Chapter 2 OHDSI 시작하기

Chapter leads: Hamed Abedtash & Kristin Kostka

“천리길도 한 걸음부터” - 노자

OHDSI 커뮤니티는 학계, 산업계 및 정부 기관 전반에 걸쳐 다양한 이해관계자들을 대표하고 있다. 본 커뮤니티의 작업으로 의료 시스템뿐 아니라 환자, 의료전문가, 연구자들을 포함한 다양한 개인들과 기관들이 혜택을 받게 된다. 이러한 이점은 의료 데이터를 더 유용하도록 개선할 뿐만 아니라 의료데이터 분석의 질을 향상함으로써 얻어지게 된다. 관찰 연구는 파괴적인 생각 disruptive thinking으로부터 크게 혜택을 받을 수 있는 분야이다. 이 분야에서는 적극적인 새로운 방법론적 도입이 필요하다.

2.1 여정에 동참하기

환자, 의료 전문가, 연구자 혹은 단순히 OHDSI의 목적에 동감하는 사람이면 누구든지 OHDSI 커뮤니티에 적극적으로 참여할 수 있다. OHDSI는 포용적 멤버십 모델을 추구하며 OHDSI의 공동연구자가 되기 위한 멤버십 비용은 없다. 참여를 원하는 사람은 단지 손을 들기만 하면 매년 OHDSI 멤버십 카운트에 포함될 것이다. 참여는 전적으로 자의에 의한 것이며 매주 커뮤니티의 네트워크 스터디나 OHDSI 작업 그룹에 참여하는 것만으로도 충분하다. 꼭 데이터를 보유하고 있어야만 OHDSI 커뮤니티의 활동 멤버가 되는 것은 아니다. 본 커뮤니티는 데이터 보유자, 연구자, 헬스케어 제공자, 환자와 소비자 모두에게 도움을 주고자 한다. 공동연구자의 프로필은 OHDSI 웹사이트에서 관리되고 정기적으로 업데이트되고 있다. 멤버십은 OHDSI 커뮤니티 원격회의, 워크그룹, 지역별 모임을 통해 육성되고 있다.

여정에 동참하십시오 - OHDSI의 참가자가 되는 법.

Figure 2.1: 여정에 동참하십시오 - OHDSI의 참가자가 되는 법.

2.1.1 OHDSI 포럼

OHDSI 포럼3은 OHDSI 커뮤니티 공동연구자들이 메시지를 올리는 형식을 통해 대화하는 온라인 토론 사이트이다. 포럼은 트리와 같은 구조로 구성되었다. 가장 상위에는 “카테고리”가 있으며 관련성 있는 토론 카테고리로 나눠진다. 각 카테고리 아래로는 하위 포럼과 추가적인 하위 포럼들로 구성된다. 각 주제 (스레드라고도 불림)의 가장 낮은 하위 포럼에서 포럼 멤버들 간의 토론 혹은 포스트가 작성된다.

OHDSI 포럼에서는 다음을 포함한 콘텐츠 카테고리를 찾을 수 있다:

  • 일반 General: OHDSI 커뮤니티와 참여 방법에 대한 전반적인 토론
  • 구현 Implementers: 로컬 환경에서 공동 데이터 모델과 OHDSI 분석 프레임워크를 구현하는 방법에 대한 토론
  • 개발자 Developers: OHDSI 어플리케이션의 오픈 소스 개발과 OMOP CDM과의 균형을 위한 도구에 관한 논의
  • 연구자 Researchers: OHDI 연구 네트워크 기반의 근거 생성, 공동 연구, 통계적 방법과 기타 CDM 기반 연구에 대한 토론
  • CDM 개발자 CDM Builders: 진행 중인 CDM을 위한 조건, 용어 vocabulary 그리고 엔지니어링 요소들에 관한 토론
  • 용어 사용자 Vocabulary Users: 용어 vocabulary 콘텐츠에 관한 토론
  • 지역 지부 Regional Chapters(예를 들면, 한국, 중국, 유럽): 지역별 언어로 진행되며 지역별 OMOP 구현과 OHDSI 커뮤니티 활동에 관한 토론

개별적인 주제로 포스팅을 올리려면 먼저 계정 등록을 해야 한다. 포럼 계정을 만들고 나면 General Topic 아래 “Welcome to OHDSI! – Please introduce yourself”라는 토픽에 다음과 같이 본인 소개를 하는 것을 추천한다. 1) 본인 소개 및 본인의 업무 소개 2) 커뮤니티 안에서 어떤 방식으로 도움을 줄 수 있는지 (예를 들면, 소프트웨어 개발, 연구, 논문 작성 등)를 본인 소개에 설명한다. 이제 당신은 OHDSI 여정에 동참하였다! 이후엔 토론에 참여하는 것을 권장한다. OHDSI 커뮤니티 포럼을 통해 자신의 질문을 포스팅하고 새로운 아이디어를 내고, 협업에 참여하길 바란다.

토픽을 “watch” 할 수도 있다. 이 뜻은 관심 있는 토픽에 새로운 포스트가 올라올 경우, 이메일로 안내를 받고 이메일 회신을 통해 다시 답장을 보낼 수도 있다는 것이다. 앞으로 다가올 미팅에 대한 아젠다도 확인할 수 있으며 공동작업 기회와 주간 OHDSI 다이제스트를 이메일로 받을 수 있다.

2.1.2 OHDSI 이벤트

OHDSI는 정기적으로 직접 참여가 가능한 이벤트를 개최하여 공동연구자들이 서로 학습하고 향후 협력 관계를 강화할 기회를 제공한다. 이러한 이벤트는 OHDSI 웹사이트를 통해 전달되며 참석에 관심이 있는 사람들에게 무료로 제공된다.

OHDSI 심포지엄은 미국, 유럽, 아시아 등에서 매년 개최되는 과학 컨퍼런스로, 이를 통해 공동 연구자들은 총회, 포스터 발표 및 소프트웨어 시연 등을 통해 각각의 최신 연구를 발표할 수 있다. OHDSI 심포지엄은 OHDSI 커뮤니티에서 진행되고 있는 최신의 동향을 배울 수 있는 최적의 장소이다. 일반적으로 OHDSI 심포지엄에서는 새로운 커뮤니티 참여자들이 데이터 표준이나 분석 방법 등에 대해 배울 수 있도록 OHDSI 튜토리얼을 같이 진행한다.

OHDSI 공동연구자들의 대면 이벤트 face-to-face event는 좀 더 규모가 작은 포럼인데, 일반적으로 공동으로 관심이 있는 특정 문제들을 중심으로 구성된다. 지난 이벤트 중에는 표현형 해커톤 phenotype hack-a-thon, 데이터 질 해커톤 data quality hack-a-thon, 오픈소스 다큐멘테이션톤 documentation-a-thon 등이 있었다. OHDSI는 다양한 스터디톤 study-a-thon 이벤트를 개최해 왔으며, 이를 통해 공동연구자들이 며칠간 함께 팀이 되어 특정 연구주제를 위한 적절한 분석을 수행하고 OHDSI 네트워크에 관한 학습, 많은 사람에게 알릴 수 있는 근거를 생성할 기회를 제공하였다. 이런 행사들을 통해 공통의 문제를 해결하려는 열망뿐 아니라, 배움과 지속적인 발전을 도모하는 우호적 환경을 OHDSI 내에서 제공하고자 하는 관심도 대두되었다.

OHDSI 커뮤니티의 힘을 보다 자세히 배우기 바란다. OHDSI 웹사이트의 OHDSI Past Events section에서 지난 심포지엄, 대면 이벤트, OHDSI 튜토리얼 등을 접할 수 있다.

2.1.3 OHDSI 커뮤니티 원격회의

OHDSI 커뮤니티 주간 원격회의 OHDSI call는 매주 OHDSI 커뮤니티 안에서 발생하는 활동들에 대해 배울 기회이다. 한국 시각으로 매주 수요일 새벽 2시 (미국 동부 시각 기준 화요일 오후 12시부터 1시)에 원격회의로 진행되고 있으며 OHDSI 소프트웨어의 최근 개발 사항뿐 아니라 개별 공동 연구자들 및 그룹 활동과 커뮤니티의 전체적인 성과를 알 기회이다. 이 미팅은 모두 녹화되고 있으며 과거 발표자료들은 OHDSI 웹사이트 리소스에서 확인할 수 있다.

우리는 모든 OHDSI공동 연구자들이 주간 원격회의에 참석하고 커뮤니티 토론을 위한 주제를 제안하기를 바란다. OHDSI 커뮤니티 원격회의는 연구 결과를 공유하고 현재 활발히 진행 중인 작업에 대한 의견을 제시하고 피드백을 얻으며, 개발 중인 오픈소스 소프트웨어를 시연하고, 데이터 모델링과 분석에 대한 모범사례를 커뮤니티와 함께 논의하고, 연구비 grant/논문 출판/컨퍼런스 워크샵 등을 위한 미래의 공동 작업 기회에 대해 많은 아이디어를 논의하는 장이 될 수 있다. 만약 원격회의 발표와 관련한 아이디어가 있다면 OHDSI 포럼에 글을 올릴 수 있다.

OHDSI 신입이라면 원격회의를 통해 OHDSI 네트워크 내에서 일어나는 일들에 대하여 알아가는 것이 좋을 것이다. OHDSI 원격회의에 참여하기 원한다면 OHDSI Wiki를 참고하기 바란다. 커뮤니티 원격회의의 주제는 매주 다르다. OHDSI 포럼의 OHDSI 주간 다이제스트를 통해 매주 발표주제에 관한 정보를 받을 수 있다. 원격회의마다 처음으로 참여하는 사람들의 배경과 OHDSI 가입 동기에 관한 소개를 받는 시간을 가진다.

2.1.4 OHDSI 워크그룹

OHDSI에는 워크그룹 Workgroup 팀들이 이끌어가는 다양한 프로젝트가 있다. 각각의 워크그룹은 커뮤니티에 기여하기 위한 프로젝트의 목적, 목표, 세부사항 등을 결정하는 리더십을 가지고 있다. 프로젝트 목적과 목표에 기여하고 싶은 참가자라면 누구나 워크그룹에 참여할 수 있다. 워크그룹은 장기적인 목표를 위해 오랫동안 유지되기도 하고, 커뮤니티의 특정 필요를 충족시키기 위한 단기 프로젝트를 위해 짧게 유지되기도 한다. 워크그룹의 정기 미팅은 프로젝트 리더들에 의해 결정되며 그룹마다 각각 다르다. 활동 중인 워크그룹의 리스트는 OHDSI Wiki에서 관리되고 있다.

테이블 2.1은 활동 중인 OHDSI 워크그룹의 레퍼런스를 제공한다. 해당 프로젝트에 적극적으로 참여하여 배우길 바란다.

Table 2.1: 주목할 만한 OHDSI 워크그룹
이름 목적 대상 인원
Atlas & WebAPI Atlas & WebAPI는 OHDSI 오픈소스 소프트웨어 중 하나로 OMOP CDM 기반의 표준화된 분석 기능을 제공하고 있다. 이를 발전시키는 것이 목적
오픈소스 Atlas/WebAPI 플랫폼의 개선과 기여하고 싶은 Java와 JavaScript 소프트웨어 개발자들
CDM & Vocabulary 임상 환자 빅데이터의 대규모 분석을 위한 체계적이고 표준화된 OMOP CDM의 지속적인 개발. 타 워크그룹에 의해 개발된 표준화된 분석을 지원하고, 국제 코딩 시스템의 커버리지를 확장하기 위해 표준화된 Vocabulary의 질적 개선이 목적
OMOP CDM의 데이터 구조와 표준 용어를 개선하고 싶은 사람
Genomics 다양한 시퀀싱 작업의 결과로 나오는 유전자 변이 정보를 OMOP CDM과 연동가능한 형태로 저장하기 위한 Genomic CDM 확장 모델 개발
유전자 데이터 연구에 관심이 있거나 경험이 있는 사람
Population- Level Estimation 정확하고 믿을 수 있으며 재현 가능한 관찰 연구의 방법론을 개발하며 이러한 방법의 사용을 촉진 제한 없음
Natural Language Processing OHDSI 관찰 데이터베이스에서 문서 데이터의 사용을 촉진하고 이를 위한 소프트웨어와 방법론을 개발 제한 없음
Patient- Level Prediction 정확하고 잘 보정된 환자 중심의 표준화된 머신러닝 예측 모델 프로세스를 구축하여 다양한 관심 영역에 사용할 수 있게 하며, 또한 어떤 소집단 환자의 데이터에도 적용할 수 있도록 함 제한 없음
Gold Standard Phenotype Library OHDSI 참여자들이 함께 검증한 표현형 phenotype 정의와 다른 커뮤니티에서 개발한 표현형 정의를 발견, 평가, 활용하도록 함 표현형의 큐레이션과 입증에 관심이 있는 사람
FHIR Workgroup OMOP CDM과 FHIR 통합에 대한 로드맵을 수립하고 OHDSI와 FHIR 상호 간에 서로의 도구와 API를 활용하여 데이터와 연구의 발전을 꾀함 상호 운용성 interoperability에 관심 있는 사람
GIS OMOP CDM을 확장하며 OHDSI 도구를 활용하여 환경지리적 요인과 환자의 임상적 표현형간의 관련성을 조사 보건 관련 지리학적 연구에 관심 있는 사람
Clinical Trials OHDSI 플랫폼과 에코시스템을 활용하여 임상 시험 개념 및 수행을 지원하고자 함 임상 시험에 관심 있는 사람
THEMIS OMOP CDM ETL 프로토콜들의 질과 재현성을 촉진하기 위하여 기본적인 OMOP CDM 규칙에 더하여 표준 규약을 발전시킴 제한 없음
Metadata & Annotations 수작업 또는 컴퓨터로 작성한 메타데이터 저장의 표준 프로세스와 CDM의 주석 annotation 형태를 정의하여 연구자들이 관찰 데이터 세트에서 유용한 데이터 아티팩트를 소비하고 만들어 낼 수 있도록 함 제한 없음
Patient Generated Health Data(PGHD) 스마트폰, 앱, 웨어러블 기기를 통해 생성된 PGHD 데이터의 ETL 규칙, 임상 데이터와의 통합, PGHD의 분석 프로세스의 개발 제한 없음
Women of OHDSI OHDSI 커뮤니티 내부의 여성들이 함께 모여 과학계, 테크놀로지, 엔지니어링, 수학(STEM) 분야에서 여성으로 겪는 도전을 나누기 위한 포럼 제공. 여성들의 입장에서 관점, 우려 사항, 아이디어를 나누며 OHDSI 커뮤니티가 STEM 분야의 여성들을 지원할 수 있을지에 대한 의견 교환. 궁극적으로 여성들이 존경받는 분야에서 여성이 리더가 될 수 있도록 장려 이 목표에 동감하는 사람
Steering Committee 모든 OHDSI 활동과 이벤트가 발전해나가는 커뮤니티의 필요사항과 부합하고 있는지 확인함으로 OHDSI의 사명과 비전, 가치를 유지함. 또한 미래 방향에 대한 지침을 제공함으로 콜럼비아 대학에 기반을 둔 OHDSI coordination center의 자문그룹 역할을 수행 커뮤니티 내의 리더들

2.1.5 OHDSI 지역 지부

OHDSI 지역 지부 Regional Chapter는 각각의 지리적 위치의 특정 문제를 해결하기 위해 로컬 네트워킹 이벤트 및 회의를 개최하고자 하는 지리적 영역에 위치한 OHDSI 공동 작업자 그룹을 대표한다. 현재 OHDSI 지역 지부는 한국4, 유럽5, 중국6 등이 있다. 한국 지부 포럼에서는 한국말을 이용하여 질문과 생각을 올릴 수 있다. 만약 본인의 지역에 OHDSI 지역 지부를 설립하고 싶다면 OHDSI website에 설명된 OHDSI 지역 지부 프로세스를 따라 진행할 수 있다.

2.1.6 OHDSI 연구 네트워크

다수의 OHDSI 공동연구자들은 자신의 데이터를 OMOP CDM으로 변환하는 것에 관심이 있다. OHDSI 연구 네트워크는 OMOP CDM의 호환성을 준수하기 위해 추출 변환 적재 Extract Transform Load(ETL) 프로세스를 거친 관찰형 데이터베이스의 다양하고 범세계적 커뮤니티를 대표한다. 만약 OHDSI 커뮤니티에서 당신의 역할에 데이터 변환이 포함되어 있다면 OMOP CDM 및 용어 vocabulary에 대한 튜토리얼, 변환을 지원하는 무료 소프트웨어, 특정 도메인 또는 데이터 타입의 유형을 타깃으로 하는 워크그룹이 있다. OHDSI 공동연구자들은 OHDSI 포럼을 활용하여 CDM 변환 중에 발생하는 문제를 논의하고 해결하는 것을 권장한다.

2.2 적합한 역할

이제 지금쯤이면 과연 나는 OHDSI 커뮤니티의 어디에 어울릴까? 라는 고민을 할 것이다.

나는 연구를 시작하려는 임상 연구자입니다. 만약 당신이 OHDSI 연구 네트워크를 사용하여 특정 임상 질문에 답을 하는 연구를 하고 싶다거나, 논문을 제출하려는 임상 연구자라면, 맞게 찾아온 것이다. 우선 OHDSI 포럼의 OHDSI Researchers Topic에 당신의 아이디어를 게시할 수 있다. 이것은 당신과 비슷한 관심사를 가진 연구자와 연결하는 데 도움이 된다. OHDSI는 논문출판을 적극 권장하며 당신의 연구 주제를 데이터 분석 및 논문으로 신속하게 전환할 수 있는 많은 자원을 보유하고 있다. 이에 관한 자세한 내용은 11장, 12장, 13장에서 확인할 수 있다.

OHDSI 커뮤니티가 생산하는 정보를 읽고 소비하고 싶습니다. 당신이 환자, 임상의사 혹은 의료 분야 세부 전문가이든, OHDSI는 임상에 대해 더 잘 이해할 수 있도록 고품질의 근거를 제공하고자 한다. 어쩌면 당신은 오랫동안 코딩을 해 온 프로그래밍 전문가일 수도 있고, 프로그래밍을 한 번도 해본 적이 없을 수도 있다. 어찌되었든 당신은 이 커뮤니티의 일환이 될 수 있다. 우리는 당신을 근거 소비자 evidence consumer – OHDSI 연구를 행동으로 옮기는 개인- 라고 부른다. 당신은 OHDSI가 어떤 근거를 만들었거나, 만들고 있는지를 파악하고 싶거나, 혹은 당신과 관련된 질문들 하고 싶을 수도 있다. 이런 당신을 토론에 초대한다. OHDSI 포럼에 질문을 올리기 바란다. 커뮤니티 원격회의에 참석하여 최신 연구를 들어보고, OHDSI 심포지엄 및 대면 미팅에 참석하여 커뮤니티에 직접 참여하도록 하라. OHDSI는 당신의 질문을 중요하게 여긴다. 당신이 어떤 근거를 찾고 있는지 우리가 알 수 있도록 목소리를 높여주기를 바란다!

나는 보건의료 분야에서 의사결정을 할 수 있는 위치에 있습니다. 나는 데이터 소유자거나 그 소유자를 대표할 수 있습니다. 나는 내 기관에서 OMOP CDM 및 OHDSI 분석 도구의 유용성을 평가하고 있습니다. 조직의 관리자/리더로서 OHDSI에 관해 들어봤을 수 있으며 OMOP CDM이 어떻게 당신의 경우에 이용될 수 있는지 궁금할 수 있다. 그렇다면, OHDSI Past Events의 자료를 통해 OHDSI의 성과를 보는 것으로 시작할 수 있다. 커뮤니티 원격회의에 참여하여 단순히 듣기만 해도 된다. 7장(데이터 분석 이용 사례)은 OMOP CDM 및 OHDSI 분석 도구를 활용하여 시행할 수 있는 연구의 종류를 이해하는 데 도움이 될 것이다. 당신을 위해 OHDSI 커뮤니티가 당신의 여정에 함께 할 수 있다. 관심 있는 특정 영역이 있다면 이에 대한 사례를 물어보는 것에 두려워하지 마라. 전 세계 200개 이상의 조직이 OHDSI 내에서 협력하고 있으며 이 커뮤니티의 가치를 보여주는 데 도움이 되는 성공 사례가 많다.

나는 내 기관의 데이터를 ETL 및 변환하여 OMOP CDM으로 변환하고자 하는 데이터베이스 관리자입니다. 당신의 데이터를 “OMOP-CDM”으로 변환하고자 하는 것은 고귀하고 가치 있는 일이다. 만약 ETL 프로세스를 막 시작하는 경우에는 OHDSI 커뮤니티 ETL 튜토리얼 슬라이드를 참조하거나 다가오는 OHDSI 심포지엄에 등록하여 튜토리얼을 듣기 바란다. THEMIS 워크그룹 원격회의에 참여하거나 OHDSI 포럼에 질문을 올릴 수도 있다. OMOP CDM의 성공적인 구현을 돕는 것에 관심이 많은 OHDSI 커뮤니티에서 풍부한 지식을 찾을 수 있을 것이다. 부끄러워하지 말고 모르는 것이 있으면 언제든 질문하라!

나는 OHDSI 툴 스택에 기여를 하고 싶은 생물통계학자 혹은 방법론 개발자입니다. 무엇보다도 OHDSI method 라이브러리에 당신의 전문 지식을 이용하여 기여하고자 하는 마음과, 방법론을 더욱 잘 개발하기 위한 당신의 열정에 감사를 표한다. 우선 인구 수준 추정이나 환자 수준 예측 워크그룹 원격회의에 참여하여 커뮤니티의 현 우선순위에 대하여 자세히 들어 보기를 추천한다. OHDSI 도구를 사용하면서 각 GitHub Repo에 문제를 제기할 수도 있다. (예를 들면, SQL 렌더 패키지의 문제일 경우 OHDSI/SqlRender에 대한 GitHub Repo에 문제를 제기하면 된다) 당신의 기여를 환영한다!

나는 OHDSI 툴 스택을 보완하는 도구 만드는 것에 관심이 있는 소프트웨어 개발자입니다. 커뮤니티에 온 것을 환영한다! OHDSI 임무의 일환으로 우리의 툴은 오픈소스로서 Apache licenses에 따라 관리된다. 우리는 OHDSI 툴 스택을 보완하는 솔루션 개발을 환영한다. 언제든 워크그룹에 참여하여 아이디어를 제안해 주길 바란다. 다만, OHDSI는 오픈 사이언스 기반의 개방형 협업에 많은 투자를 하는 점을 유의하자. 독점적인 알고리즘과 소프트웨어 솔루션도 환영하지만, 우리 소프트웨어 개발 작업에서 그런 작업은 주요 관심사가 아니다.

나는 OHDSI 커뮤니티에 조언하고 싶은 컨설턴트입니다. 환영한다! 당신의 전문 지식은 매우 귀중하다. 필요에 따라 OHDSI 포럼에 적절히 본인의 서비스를 홍보해도 된다. OHDSI 튜토리얼에 참여하길 바라며 당신의 전문성으로 매년 열리는 심포지엄 및 OHDSI 대면 미팅 행사 개최 등을 도와줄 수 있으면 좋겠다.

나는 OHDSI에 대하여 더 배우고 싶은 학생입니다. 올바르게 찾아왔다! OHDSI 커뮤니티 원격회의에 참여하여 본인을 소개하는 것을 고려하자. OHDSI 튜토리얼을 참고하고 OHDSI 심포지엄의 대면 미팅에 참여하여 OHDSI 커뮤니티가 제공하는 방법과 도구에 관하여 자세히 알아보라. 만약 특정 연구에 관심이 있다면 OHDSI 포럼의 연구자 토픽에 글을 올려보기 바란다. 다양한 조직에서 OHDSI가 후원하는 연구 기회 (예를 들면 박사후과정, 연구 펠로우십)를 제공한다. OHDSI 포럼은 이러한 기회 등에 대한 최신 정보를 제공할 것이다.

2.3 요약

  • OHDSI 커뮤니티를 시작하기란 매우 쉽다! OHDSI Forum에 글을 올리고 원격 회의에 참여하라.

  • OHDSI 포럼에 본인의 연구나 CDM, ETL에 관한 질문을 올리기 바란다.