2009년 11월 14일 토요일

Spleen and PP

Speen
  • The spleen is the major site of adpative immune responses to blood-borne antigens. The spleen ingest 0psonized antigens and daaged red blood cells and contains lymphocytes and lymphoid follicles where B cells are activated (educaton)

PP (Peyers patch)

  • Organized lympohoid tissue in the lamina propria of the samll intestine in which immune responses to ingested antigens may be initiated. Peyers patches are composed mostly of B cells, with smaller numbers of T cells and accessory cells, all arranged in follicles similar to those found in lymph nodes, oftern with germinal centers.

2009년 11월 12일 목요일

CNV - Copy Number Variation

  • CNV는 structural variation 중 하나이며, 대략 1kb 이상을 의미하며, diploid genome 중에서 1n...3n...이상도 존재한다. 즉 반드시 2n이 아니다.
  • human genome 에서 about 5~8% 정도 존재
  • CNV를 이용해서 association study하기는 아직 어렵다. 대신 target base 접근이 주로 perform.
  • CNV는 tissue별로 다르다. 발생빈도는 1o^-6 to 5x1o^-5 정도이며 이는 point mutation보다 높은 빈도이며, 원인은 homologus & non-homologus recombination
  • Deletion이 대세다 rather than duplication. KARe에서는 among about 4,000 peoples, duplication is 59,000 & deletion 272,000. 그러나 heathy individual has equal ratio between duplication and deletion. CNV is medelian inheritance.
  • Interestingly, SNP가 meaningful 하게 나타나는 region (promoter 영역 등) 에서는 CNV가 발생하지 않는다. 그 반대도 성립하기 때문에, SNP와 CNV가 나타나는 영역이 서로 겹치지 않기 때문에, 그 origin or role 이 서로간에 different 할 것임.

Genome-wide Association Study

  • Trends in GWAS
  1. 2007~2008:
    QT 분석 발굴, Associated SNP 발굴, & replication study of that. ie. this period is individual population GWAS study.
  2. 2008~2009:
    variable data를 묶어서 GWA 수행하는 meta analysis 유행 (combined anaysis). 이것을 위해서는 different platform array들을 하나로 merging하는 imputation step is required. 원리는 ?
  3. 2009~:
    도출된 SNP가 진짜 인지 아닌지를 확인하는 단계 using NGS machine
  4. 그 이후:
    Biological validation, 이를 위해 HTS method가 필요
  • 인구집단에 따라
    - Allele frequency,
    - LD structure
    - 환경적 차이
    - 각 잡단에 특징적인 돌연변이가 존재하기 때문에 충분히 질병에 영향을 가짐.
  • KARe 에서는
    - Sample w/ BRLMM call rate > 95%
    - Remove sample w/ 성감별 불가, 환자 샘플
    - Remove sample w/ heterozygosity > 30%
    - Remove sample w/ HWE <1e-6 : HWE가 크면 외부에서 들어온 가능성이 농후
    - Remove SNP w/ call rate < 95%
    - Remove SNP w/ MAF <0.01

Chronic Myeloid Leukemia

  • CML 은 거의 Bcr-Abl 유전자를 처리함으로써, 거의 해결됨
  • c-Abl이란 것은 oncogene중 하나이며, translocation이 가능하다.
  • Translocation of c-Abl to Bcr region causes CML
  • Gleevec은 Novatis가 개발한 백혈병치료제로서 독성이 거의 전무하다. 이것은 Structure-based drug discovery 전략에 의해 Bcr-Abl gene을 targetting하여 개발되었기 때문
  • Gleevec의 약효가 없는 case가 있는데, 이는 P315I mutaion of Bcr-Abl gene가 원인이며, 아직까지 이것을 해결한 CML drug는 없다.

Wnt Signal pathway inhibitor for AML therapy

  • 앞으로는 분자표적치료 항암제가 크게 각광 받을 것.
  • 특히 전사인자들의 상호작용을 targeting하는 것이 의미가 있다.
  • Wnt (윈트) 가 발견된지는 벌써 20년이 넘었지만, 관련 치료제는 전무함. Wnt 대가는 Dr. Randolf Moon.
  • AML (Acute Myeloid Leukemia)에서는 Wnt 경로의 비정상 활성화가 60% 차지
  • Wnt는 b-cateninin, CBP (CREB-binding P)의 interactin(complex) 에 의해 transactivation 된다. b-catenin이 ubiquitination되면 윈트가 활성화되고, 그렇지 않으면 반대. b-catenin은 윈트경로의 가장 주요 신호 mediator.
  • CWP231A가 b-catenin/CBP 전사활성 저해제.
  • AML에서는 APC (단백질)의 돌연변이가 80% 이상 차지한다.
  • Wnt 신호경로에 있어, b-catenin, survivin, c-Myc의 발현이나 modification을 보는 것이 윈트 활성화를 보는 것과 같다.
  • 신호전달경로를 저해하는 물질이 치료제로서 독성이 낮다.
  • PPI를 저해하는 drug screening을 위해서는 현재로서는 나오지 않는다. 왜냐하면 상호작용 면적이 크기 때문인데, 먼저 a-helix, b-turn or sheet or strand, 등의 mimics를 설계하는 것이 우선, 그다음 이것들을 이용하여 durg screening 함.
  • 이런 library가 아사라이브러리 (Arsa?)
  • b-catenin/CBP 인터액션이 Wnt에서 전사활성의 핵심.

2009년 8월 11일 화요일

VHGDP-CEPH Human Genome Diversity Cell Line Panel

VHGDP-CEPH Human Genome Diversity Cell Line Panel

51개 민족, 1050 명, 1063 임파섬유아세포주 (lymphoblastoid cell line, LCL), 밀리그램양의 DNA이 쟝도세박사 재단에 기탁.

Human Genome Diversity Project (HGDP), CEPH에 의해 여러 실험실로부터 LCL이 수집: 서열다양성, 현대인류집단의 역사에 대한 연구를 위한 제한없는 DNA제공을 위함. 성별, 민족, 국가지리정보에 제한됨.

지금까지 650K SNP, 853 microsatellite 밝혀짐.

이 정보들을 제공하는 디비가 HGDP-CEPH HUMAN GENOME DIVERSITY PANEL DATABASE WEB VERSION 2.0 이고 최신버전.

패널은 13쌍의 duplicate LCL을 가짐. 이는 2개의 유전적으로 비전형적인 개인으로부터 온 것임.

서플1은 일루비나 650K로 찍은 지노타입 플랫파일
서플2는 일루미나 550K로 찍은 플랫 파일 데이터

데이터기탁자가 공개시일 제한하지 않으면, 디비를 통해 계속 공개, 제한을 원하면 6개월뒤에 종료됨.

2009년 7월 15일 수요일

Effect size

이 내용은 영문위키에 있는 effect size를 번역한 것입니다. 원문은 wikipedia.org 가셔서 effect size를 치시면 됩니다.

  1. effect size (효과크기)
    통계에서, effect size는 통계적 집단이나, 샘플의 양적 추정에 있어, 두 변수간의 관계(관련)의 강도에 대한 측정값(결정값)을 의미한다.<해석도 어렵다 T..T>"효과크기"라고 하는데, 대조군의 평균에 실험군의 평균을 normalization (표준화) 시킨것이다. 샘플에 기반한 효과크기는 가설검증에 사용되는 검증통계 (test statistics)과는 구별된다. 즉, 샘플기반 효과크기의 가설검증이란, 명백한 관계의 강도를 추정하는 것이지, 우연에 의한 관계인지 아닌지를 나타내는 유의수준을 보는 것이 아니다. 과학적 실험과 관측연구에 있어, 관계가 통계적으로 유의한지를 알 수 있을 뿐만 아니라, 관측된 관계의 크기 (size)도 알 수 있다. 실제 상황에서, 효과크기는 의사결정에 도움이 된는데, 먄약, 관계의 유의성이 높다할 지라도, 효과크기가 작다면 흥미롭지 않기 때문이다. 따라서 효과크기의 측정은 메타분석(meta-analysis) 연구에서 중요하다. (메타연구는 특정 연구분야의 결과물 및 통계파워분석 결과까지 정리하는 연구이다).

    ES가 0 이라는 것은 실험군의 평균과 대조군의 평균이 같다는뜻이고, ES가 - 라는 것은 대조군의 평균보다 실험군의 평균이 작다는 것을 의미하니다. + 라는 것은 실험군의 분포모양이대조군보다 오른쪽에 있다는 것으로 실험군의 평균이 크다는 것을 의미한다.

    ES 의 값의 크기는 정규분포의 Z 값과 동일한 의미를 갖는다. 예를 들어 ES 가 1.96 이라면 실험군의 평균은 대조군의 분포에서 상위 5%에 해당한다는 것을 의미한다.

    결국 ES 라는 것은 실험군과 대조군의 평균 차이에 대한 표준화된 값으로 이 값이 크다는 것은 결국 실험의 높다는 것을 의미하며 0 이라는 것은 실험의 효과가 없다는 것을 의미하는 것이다



  2. 효과크기의 종류
  • 피어슨 감마 상관계수
  • 평균에근거한 효과크기(평균기반효과크기) : 코헨's d, 글라스's 델타, 헷지's 감마, 평균기반효과크기의 분포
  • 코헨's f^2
  • 파이, 크래머's 파이, 크패머's V
  • 오드값 (odd ratio)
    The odds ratio (OR) is another useful effect size. It is appropriate when both variables are binary. For example, consider a study on spelling. In a control group, two students pass the class for every one who fails, so the odds of passing are two to one (or more briefly 2/1 = 2). In the treatment group, six students pass for every one who fails, so the odds of passing are six to one (or 6/1 = 6). The effect size can be computed by noting that the odds of passing in the treatment group are three times higher than in the control group (because 6 divided by 2 is 3). Therefore, the odds ratio is 3. However, odds ratio statistics are on a different scale to Cohen's d. So, this '3' is not comparable to a Cohen's d of '3'.
  • 상대적위험도 (relative risk)

    The relative risk (RR), also called risk ratio, is simply the risk (probability) of an event relative to some independent variable. This measure of effect size differs from the odds ratio in that it compares probabilities instead of odds, but asymptotically approaches the latter for small probabilities. Using the example above, the probabilities for those in the control group and treatment group passing is 2/3 (or 0.67) and 6/7 (or 0.86), respectively. The effect size can be computed the same as above, but using the probabitities instead. Therefore, the relative risk is 1.28. Since rather large probabilities of passing were used, there is a large difference between relative risk and odds ratio. Had failure(a smaller probablility) been used as the event (rather than passing), the difference between the two measures of effect size would not be so great.

  • 참고사항
    오드비(OR)와 상대위험도 (RR) 모두 측정에 있어 유용하나, 그 통계적 활용은 서로다르다. 예를 드면, 임상연구의 경우, 오드비는 case-control 연구와 retrospective 연구에 가장 활용되는 방법이다. 반면 상대위험도(RR)은 randomized controlled trials 나 코호트 연구에서 사용된다. 그러나 OR로 RR을 예측한거나, RR로 OR을 자동적으로 예측할 수는 없다. (즉, OR값을 가지고 RR값을 예상할 수 없다는 말이다. 다만, OR 계산시 사용된 데이터가 있다면 RR 계산이 가능하다).