Vietnamen’s Weblog

Time, Chances, Diligence, Intelligence: which is the most important?

Archive for Tháng Tám 2008

Di truyền phân tử 9 – determine the gene sequence

with 2 comments

Trong di truyền cổ điển, Mendel mô tả gene là một đơn vị di truyền rời rạc có ảnh hưởng đến tính trạng biểu hiện ra bên ngoài (visible trait hay phenotype). Sau này BeadleTatum định nghĩa lại một gene là một thành phần chứa thông tin hướng dẫn để tạo ra một enzyme (là loại protein đóng vai trò quan trọng trong quá trình trao đổi chất của tế bào). Tuy nhiên, định nghĩa này vẫn chưa hoàn chỉnh. Trong di truyền học hiện đại, quan niệm về gene rõ ràng hơn: đó là một đoạn (segment) trong chuỗi DNA nhằm mã hóa cho một protein, và được bắt đầu bằng một “start” codon (AUG) và kết thúc bằng một “stop” codon (UAG, UGG, hoặc UGA).

Các kĩ thuật phân tích gene đã cho phép con người có những bước tiến lớn trong việc xác định trình tự các chuỗi nucleotides tạo thành một gene cụ thể. Và kĩ thuật phổ biến nhất là “chain termination“, do Fred Sanger phát triển (1977) có sử dụng “defective” DNA nucleotide (~ tức là nucleotide đã bị chỉnh sửa làm mất khả năng kết hợp thêm một nucleotide khác tại 3′-end của nó –> chiều dài của chuỗi DNA bị gián đoán, không hoàn chỉnh về chiều dài), tốt hơn phương pháp trước đó là “Maxam-Gilbert sequencing” technology (1975).

Sanger sequencing

Tạo ra “defective” DNA nucleotide:

Đến thập niên 1970, Sanger đưa ra phương pháp để xác định chính xác trình tự chuỗi nucleotides trong một gene. Phương pháp này dựa trên kết quả của Arthur Kornberg về quá trình tự nhân đôi của DNA (DNA replication) – một DNA strand mới được tổng hợp dựa vào thông tin chuỗi từ một DNA template) nhờ vào enzyme DNA polymerase III để kết nối các nucleotide riêng rẽ. Ví dụ DNA template là một poly-thymine DNA, thì DNA strand mới tạo thành sẽ chứa toàn Adenine (theo nguyên tắc bắt cặp (base-pair): A-T, G-C).

Giải thích hình trên: Trong quá trình hình thành chuỗi  DNA mới, phosphate ở đầu C-5′ của deoxynucleotide triphosphate (dNTP), trong trường hợp này là dATP, tự do đi vào sẽ gắn với đầu C-3′ ở cuối chuỗi mới. Tiếp đến, liên kết ester giữa hai nhóm hydroxyl ở 2 chuỗi (strand) sẽ được tạo ra. Theo cách này, chuỗi nucleotides mới sẽ được nối dài dựa trên thông tin của chuỗi nucleotides làm mẫu (template strand). Phương pháp của Sanger mấu chốt ở việc sử dụng dideoxynucleotides triphosphate (didNTP), ở đây là didATP, với đặc tính hóa học riêng biệt. Cũng như dNTP, didNTP được kết hợp vào chuỗi bằng cách hình thành liên kết phosphodiester tại đầu cuối C-5′. Tuy nhiên, didNTP thiếu một nhóm -OH ở đầu C-3′ cần thiết cho việc hình thành liên kết với nucleotide kế tiếp. Điều này có nghĩa là việc thêm nucleotide mới tiếp vào sau vị trí của didNTP sẽ không thực hiện được, xem hình sau. Dựa vào đó, Sanger thiết lập 4 phản ứng diễn ra tại 4 lọ thí nghiệm riêng biệt – từ đó có thể truy ra thông tin về trật tự liên kết của các nucleotides trong template strand. Mỗi lọ phản ứng gồm: 1 template DNA (giống nhau cho cả 4 lọ), 1 primer ngắn (là chuỗi gồm khoảng 20 nucleotides – đề làm “mồi” cho quá trình gắn kết nucleotide vào tiếp – cũng giống nhau cho cả 4 lọ), DNA polymerase III (chất xúc tác cho quá trình tổng hợp nucleotide strand), và hỗn hợp chứa 4 loại dNTPs tự do – dATP, dGTP, dTTP, dCTP – (trong đó một loại được đánh nhãn phóng xạ hoặc được nhuộm màu huỳnh quang tùy vào lọ, ví dụ: lọ 1 thì có dATP được đánh nhãn phóng xạ, lọ 2 thì có dGTP được đánh nhãn phóng xạ). Sau đó, mỗi loại didNTP – A, T, C, hoặc G – được thêm vào mỗi lọ thí nghiệm độc lập ở trên (ví dụ: lọ 1 thì được thêm didNTP Adenine, lọ 2 thì được thêm didNTP Cytosine…). Với các nguyên liệu nêu trên, quá trình tổng hợp ra nucleotide strand mới sẽ được diễn ra trên mỗi lọ. Nó sẽ dừng lại khi có một didNTP được gắn vào. Do đó, chiều dài của DNA strand mới là ngẫu nhiên và dài ngắn khác nhau ở mỗi lọ phản ứng. Nồng độ (concentration) của didNTP được thêm vào thấp hơn rất nhiều so với các dNTP có sẵn –> giúp đảm bảo là DNA strand tạo ra đủ dài. Lưu ý là phân tử DNA tồn tại ở dạng double strands, do đó để có DNA template, ta cần bẻ gãy liên kết hydrogen bonds (giữa 2 strands). Để tách chúng ra, ta nung bằng nhiệt độ, hydrogen bonds sẽ nhanh chóng đứt gãy, primer sẽ có dịp gắn vào DNA template tương ứng với nó (Chú ý là với một primer xác định, chỉ có 1 strand là có thể làm template). Quá trình phản ứng, lấy lọ 1 là nơi có DNA strand mới kết thúc bằng didATP làm ví dụ. Tại lọ 1: Ban đầu, phân tử double-strand DNA tách thành 2 dải riêng biệt tại gần 100độ (near-boiling temperature). Vì ở nhiệt độ cao, chuyển động động học (kinetic motion) của phân tử DNA giúp phá hủy liên kết hydrogen (liên kết yếu) giúp giữ hai DNA strands với nhau. Khi nhiệt độ giảm lại, primer sẽ gắn vào template DNA theo qui luật bắt cặp (base-pairing). Kornberg đã chứng minh rằng primer là cần thiết để DNA polymerase bắt đầu quá trình replication. Phản ứng tạo DNA strand mới sẽ diễn ra tới khi didNTP Adenine gắn vào thì chuỗi không thể dài thêm được nữa. Quá trình tổng hợp sẽ bị ngắt (terminated) và ta có một chuỗi DNA bổ sung (complement DNA strand) với kích thước bị giới hạn, nên ta gọi là  DNA fragments. Như vậy, tùy thuộc vào thời điểm didNTP Adenine gắn vào, DNA fragments thu được sẽ có chiều dài dài ngắn khác nhau. Trong lọ 1, ở hình vẽ dưới, didATP (màu tím), ở các lần TN khác nhau, ta thu được các DNA fragments với các chiều dài khác nhau.

NOTE: DNA polymerase không phân biệt giữa dNTPs và didNTPs. Bên cạnh các nucleotides bình thường là thành phần của DNA fragment, sẽ có các nucleotide được đánh nhãn phóng xạ. CHÚ Ý: Ở hình vẽ trên, tương ứng với lọ 1, các dNTP Adenine luôn được đánh nhãn phóng xạ. Nên với các dNTP Adenine ban đầu, ta phải hiểu là chúng được đánh nhãn phóng xạ. Kết quả cũng tương tự với 3 lọ còn lại (mỗi lọ sẽ có các DNA fragments mới với nucleotides kết thúc chuỗi tương ứng là didCTP, didTTP, và didGTP).

Xác định trình tự DNA template

Trình tự của chuỗi DNA template có thể xác định gián tiếp thông qua trình tự của chuỗi DNA mới tạo thành, dựa trên nguyên lí bổ sung cho nhau.

Sau quá trình tạo ra “defective” DNA fragment, ta sẽ nung nóng ở mỗi lọ phản ứng nhằm tách DNA fragment mới ra khỏi DNA template. Sau đó, DNA fragment sẽ được đưa riêng rẽ vào một môi trường gọi là polyacrylamide gel (mỗi fragment sẽ được phân cách, nằm trên một làn khác nhau, nhờ có chứa urea giúp ngăn các DNA fragments ở hai lọ khác nhau khỏi gắn kết với nhau trong quá trình điện phân (electrophoresis). Quá trình electrophoresis sẽ giúp 4 strands di chuyển từ cực (-) sang cực (+). Các gốc phosphate bị ion hóa (ionized phosphate – ) làm cho các DNA fragments có điện tích âm. Tùy vào số lượng nucleotides trên mỗi DNA fragments, tổng điện tích âm của 4 strands sẽ khác nhau. Tuỳ vào điện tích mỗi strand, chiều dài di chuyển của chúng cũng khác nhau. Vì thế mỗi DNA fragment sẽ dịch chuyển về cực dương của trường điện từ và dừng lại ở các vị trí khác nhau (với độ phân giải đến 1 nucleotide đơn lẻ – nghĩa là 2 DNA fragments chỉ khác nhau về số lượng 1 nucleotides cũng có thể phân biệt được).

NOTE: Ngoài yếu tố điện tích, yếu tố kích thước cũng ảnh hưởng đến việc dịch chuyển của các DNA fragments qua lưới polyacrylamide (polyacrylamide matrix) – DNA fragments có kích thước nhỏ thì dịch chuyển xa, và ngược lại.

Để theo dõi quá trình dịch chuyển của các DNA fragments, một chất nhuộm màu màu xanh được đưa vào – chúng luôn dịch chuyển nhanh hơn một tí so với DNA fragment nhỏ nhất trong hỗn hợp. Qua quá trình electrophoresis, các DNA fragments ngắn hơn thì dịch chuyển nhanh hơn. Các DNA fragments có cùng kích thước sẽ dịch chuyển về cùng 1 vị trí. Kết thúc quá trình electrophoresis, gel matrix sẽ được chiếu lên tia X và chụp hình lại. Điều này giúp nhận dạng các vị trí của các dNTP được đánh nhãn (nổi lên thành các dải màu đen (black band)). Với lọ 1, nhờ vào Adenine được đánh nhãn phóng xạ tồn tại trong DNA, nó sẽ phát ra hạt beta hiển thị lên phim và cho ta thấy vị trí của các DNA “band” đó trong gel. Tương tự với DNA bands từ các lọ còn lại. Vì đã biết là DNA fragment từ lọ nào nằm ở vi trí nào, nên ta có thể biết là DNA fragment đó có chứa dATP nào được đánh nhãn phóng xạ. Như vậy nếu ở cột 1, có band được hiển thị, thì ta biết đó là dATP được đánh nhãn phóng xạ, và vì cả 3 DNA fragments còn lại cùng với DNA ở cột 1 cũng từ 1 DNA template tạo ra và khởi đầu tại cùng 1 nucleotide, nên chắc chắn là nucleotide ở hàng tương ứng với band được hiển thị đó cũng là dATP (chỉ khác là dATP này không được đánh nhãn phóng xạ nên không nhìn thấy). Dựa vào đó, ta có thể đọc (đi từ dưới lên) để nắm được trình tự nucleotides ở 4 cột dựa vào band ở cột nào mà có đánh nhãn phóng xạ để suy ra nucleotide ở các cột còn lại. Hình ảnh sau sẽ cho ta cái nhìn cụ thể hơn khi mà mỗi band sẽ có ddATP được nhuộm màu khác nhau.

Automated sequencing machine

Công việc xác định trình tự từ các band này rất cần được tự động hóa, và thế là các “automated” sequencing machine ra đời. Vì mỗi chất nhuộm màu có một bước sóng riêng, các máy này sẽ dùng tia laser để xác định bước sóng để từ đó định ra nucleotide tương ứng, và hình ảnh về các đỉnh (peak) của 4 loại bước sóng khác nhau được hiển thị như trong hình vẽ sau (còn gọi là chromatogram — Greek: chromo = color, gram = writing). Mỗi loại nucleotide tương ứng với các peak có độ cao khác nhau. Phương pháp Sanger cho ta mỗi đoạn ngắn (gọi là “read”, “segment”, “fragment”) trong khoảng 500-1000pbs. Và các máy tự động đọc chiều dài của fragment mỗi lần là khoảng 200-500 bps (base pairs) và gần đây là 900 bps.

TEST

1. Để kiểm tra cách đọc, ta có thể dựa vào hình vẽ bên và cho biết chuỗi nucleotide nào trong 4 lựa chọn trên là đúng với chuỗi 20 nucleotides đầu tiên của DNA fragment.

2. Kết quả thu được là trình tự đọc theo chiều 5′ –> 3′ của DNA fragment, vậy, trình từ 3′ –> 5′ của complement DNA template là gì? 3. Nếu mRNA được tổng hợp từ complement DNA template này theo chiều 3′–>5′, vậy chuỗi nucleotide của mRNA theo chiều 5′–>3′ là gì?

NOTE: Fred Sanger cũng là người đầu tiên xác định được trình tự amino acids trong một protein (1950s). Đó là insulin protein với 51 amino acids. Tuy nhiên, điều này không cho phép ta xác định được trình tự của nucleotides mã hóa cho insulin protein (lí do đã đề cập trong phần trước – nhiều codons có thể mã hóa cho cùng một nucleotide).

Next-generation sequencing technology

Hiện nay, người ta thường nhắc đến một kĩ thuật mới giúp tăng khả năng xác định trình tự lên high throughput, và chi phí thấp gọi là “next-generation sequencing technology” với chiều dài các “reads” ngắn hơn, gọi là “short-reads”, vào khoảng 80-100bps thậm chí 20-30bps.

TERMS

  • gene: tại thời điểm này, quan điểm về gene đã được cập nhật, đó là một phân đoạn trong chuỗi vô cùng lớn DNA. Gene mã hóa cho một protein. Đơn vị cấu trúc của protein là nucleic acid (ta đã đề cập). Ta biết là có 20 loại nucleic acids đóng vai trò cấu thành một protein (CHÚ Ý: nếu không bắt buộc là đơn vị cấu thành ban đầu một protein, thì số lượng nucleic acids rất nhiều – khoảng 100). Gene gồm các nucleotides (có 4 loại nucleotides, trong RNA thì kí hiệu là  A, U, G, C – ta đã tìm hiểu trong phần central dogma), nên cứ mỗi bộ 3 nucleotides sẽ mã hóa cho một nucleic acids (xem phần DNA words). Ta gọi bộ ba này là một codon. Condon đánh dấu bắt đầu một gene là “start” codon: AUG, và codon đánh dấu kết thúc một gene là “stop” codon (có 3 lựa chọn): UAG, UGG, UGA.
  • electrophoresis: là kĩ thuật phân tách các phân tử dựa vào tính chất vật lí là khối lượng, kích thước, và đích tích của chúng.
  • chromatogram: sắc phổ kí

SUMMARY:

LINKS:

  1. http://www.genomenewsnetwork.org/resources/timeline/1977_Gilbert.php
  2. http://en.wikipedia.org/wiki/DNA_sequencing
  3. http://www.bio.davidson.edu/Courses/Molbio/MolStudents/spring2003/Obenrader/sanger_method_page.htm

ANSWER: 1. Chuỗi thứ nhì.

Một số hình ảnh minh hoạ cho chromatogram

Written by vietnamen

Tháng Tám 16, 2008 at 3:08 chiều

Di truyền phân tử 8 – DNA words

with one comment

“Ngôn ngữ” của DNA là nucleotides trong khi “ngôn ngữ” của protein là amino acids. Vậy cần một phép ánh xạ nào đó để chuyển đổi từ các nucleotides sang các amino acids. Trong di truyền phân tử 7, ta biết rằng chuỗi nucleotide qui định trật tự liên kết các amino acids.

Có tất cả 20 amino acids tham gia vào cấu thành proteins (trên tổng số hơn 50 loại được phát hiện). Có 4 loại nucleotides khác nhau, nếu với chuỗi 2 nucleotides thì có thể biễu diễn 4^2=16 amino acids. Vậy cần ít nhất là chuỗi 3 nucleotides để có thể biểu diễn 20 amino acids, lúc này, số trật tự tạo thành là 4^3=64.

Và cứ bộ 3 nucleotides ghép lại để biểu diễn cho 1 amino acids thì được gọi là 1 codon – hay còn gọi là 1 DNA word. Điều này được khám phá bởi Marshall Nirenberg cùng với nhóm của Har Khorana hay họ đã bẻ khóa được mã di truyền.

Năm 1962, Heinrich Matthaei Marshall bắt đầu thí nghiệm để kiểm tra giả thuyết về “triplet codon”. Họ dùng chiết xuất từ E.coli vì họ tin rằng chúng có đủ mọi thành phần để chuyển mRNA thành proteins. Họ dùng DNase để hủy mọi DNA trong đó, để không còn template tạo ra mRNA. Và họ đưa vào đó một mRNA nhân tạo chỉ chứa toàn Uracil (nhờ phương pháp của Marianne Grunberg-Manago và Severo Ochoa). Tiếp đó, các amino acids được đánh nhãn phóng xạ (radiolabeled amino acids) cũng được thêm vào.

Hỗn hợp thu được đưa vào máy li tâm, để quá trình phản ứng tạo protein xảy ra. Kết quả thu được là chuỗi polypeptides gồm toàn phenylalanine (PHE). Có nghĩa là triple UUU mã hóa cho PHE.

Họ làm thí nghiệm tương tự với các chuỗi mRNA nhân tạo khác chứa toàn hoặc Cystosine (thu được polypeptide proline (PRO)), hoặc Arguanine (thu được lysine (LYS)), hoặc Guanine (không thu được gì).

Với phương pháp đó, họ cùng các nhà khoa học khác dùng các RNA nhân tạo khác với trật tự kết hợp của các nucleotides khác nhau. Cuối cùng đã có thể tổng hợp được bảng sau với 50 triple codons

Còn một vài chỗ trống trong bảng trên là do không thể tạo được mRNA nhân tạo dài có trật tự liên kết các nucleotide theo ý muốn. Ví dụ: một triple với hai G và một C thì có 3 khả năng xảy ra: CGG, GGC, GCG. Nên việc tạo ra chuỗi dài cùng đồng nhất một loại triple là rất khó.
Phil Leder đã giúp hoàn thành phần còn lại bằng cách dùng tRNA đã được hoạt hóa (activated tRNA) để giải quyết vấn đề đó. (activated tRNA là tRNA khi nó đã có mang theo amino acid)
Trong phần trước, ta đã biết tRNA là phân tử đem amino acids đến ribosomes để giúp tổng hợp protein. Mỗi tRNA sẽ gắn với một loại amino acids, vì thế có tất cả 20 loại tRNA. Năm 1962, Robert Holley đã tìm ra cấu trúc của tRNA. Mặc dù tRNA là một dải đơn, nhưng các nucleotides trên đó có liên kết hydrogen bon để tạo thành một vùng dải kép ngắn (như hình vẽ), làm cho tRNA có hình dáng như lá của cây cỏ ba lá (cloverleaf).

Holley cho thấy rằng mọi tRNA đều có cấu trúc dạng lá cây ba lá như nhau. Tại một vị trí trên một trong các lá, một chuỗi gồm 3 nucleotides sẽ tạo thành một anti-codon, nó có chức năng đóng cặp với một mRNA codon tương ứng. Có nghĩa là, với mỗi mRNA codon, sẽ có một tRNA tương ứng không trùng lặp gắn vào nó để dựa vào đó, tRNA có thể kết hợp với amino acid mà mRNA codon đó mã hóa.

Dùng hệ thống “cell-free translation system”, Zamecnik và nhóm của ông cho thấy tRNA được hoạt hóa khi có một amino acid gắn vào thân của tRNA đó (tRNA’s stem). Quá trình này đòi hỏi năng lượng (từ ATP).

Như vậy thay vì dùng một chuỗi mRNA nhân tạo dài, ông chỉ dùng với chuỗi gồm 3 hoặc 6 nucleotides. Và tiếp đến cứ cho tRNA đã hoạt hóa gắn kết với chuỗi mRNA ngắn này (như hình vẽ). Và Phil Leder đã đề xuất ra cách để tách tRNA đã hoạt hóa đang được gắn với triple codon đã biết ra để tìm hiểu amino acid gắn vào tRNA đó là loại gì (theo hình vẽ). Từ đó, cho phép ta xác định amino acid mà triple codon này mã hóa.

Kết quả thu được là bảng đầy đủ các loại triple codons và amino acdis tương ứng mà nó mã hóa:

Đồng thời, Leder còn tìm hiểu được một gene được bắt đầu và kết thúc bởi các triple codone terminals như sau:

  • start codon: AUG
  • stop codons: UAA, UAG, UGA

Với một amino acid, có thể có nhiều triple codons khác nhau cùng mã hóa cho nó. Có nghĩa là, biết được chuỗi amino acids của một protein, thì không thể biết được chuỗi nucleotide của gene mã hóa cho protein đó.

Ví dụ: về sự thay đổi chuỗi polypeptide tạo thành khi có một hay nhiều nucleotide bị mất đi khỏi chuỗi mRNA (frame shift)

List of amino acids:

ARG: arginine

PRO:

PHE:

Vào đầu thập niên 1970, Fred Sanger đã phát triển phương pháp xác định được trình tự chuỗi các nucleotide trong một gene, gọi là “chain termination method”. Phương pháp này được dùng phổ biến hơn phương pháp của Alan Maxxam và Walter Gilbert. Ta sẽ tìm hiểu phương pháp này trong phần tiếp sau.

Written by vietnamen

Tháng Tám 16, 2008 at 3:06 chiều

Di truyền phân tử 7 – DNA –> RNA –> protein (central dogma)

with one comment

Đây là hình ảnh cắt lát của tế bào. Nhìn tổng thể, đó là một bộ máy phức tạp với nhiều cơ quan có màng bao bọc. Các bộ máy này hoạt động đồng bộ với nhau để giúp cho tế bào hoàn thành chức năng sống.

DNA chứa genes tồn tại trong nhân tế bào (nucleus). Tuy nhiên, quá trình tổng hợp ra protein được mã hoá bởi genes lại được diễn ra riêng biệt trong tế bào chất (cytoplasm) mà cụ thể là tại ribosome – nằm ngoài nhân. Vậy câu hỏi đặt ra là “làm cách nào gene, là một phần của DNA nằm, trong nhân tế bào có thể giúp cho quá trình tổng hợp protein nằm ngoài nhân?“.

Để trả lời, Francis Crick đã đề xuất khái niệm “Central Dogma” -theo đó thông tin di truyền được truyền 1 chiều: nghĩa là từ phân tử  DNA thông tin được mã hoá sang mRNA rồi phân tử mRNA được vận chuyển ra ngoài nhân, tại đó thông tin được giải mã để sản xuất ra protein tương ứng. mRNA đóng vai trò là một loại phân tử truyền tải (carrier molecule). Và ông cho rằng ứng cử viên cho chức năng truyền tải đó là RNA được tìm thấy ở khắp cytoplasm của tế bào – mà sau này Sydney Brenner, Francois Jacob, và Matthew Meselson xác định sự tồn tại của carrier molecule này và đặt tên là mRNA (messenger RNA).

RNA là ribose nucleic acid được tìm thấy chủ yếu trong cytoplasm. RNA cũng có backbone là sugar-phosphate như phân tử DNA. Điểm khác biệt đầu tiên là RNA dùng đường ribose, còn DNA dùng đường deoxyribose (nhóm -OH tại C2′ được thay bởi -H).

Điểm khác biệt thứ 2 là DNA có các base A, T, G, C còn RNA đi với các base A, U, G, C (Thymine thay bằng Uracil). Tương ứng, ta có qui luật bắt cặp cho RNA là A-U, G-C qua hydrobonds.Điểm khác biệt thứ 3 và cuối cùng đó là, DNA phần lớn thời gian tồn tại ở dạng phân tử kép (double-strand molecule) còn RNA là phân tử đơn (single-strand molecule).

“Old” Central Dogma

Như vậy, ‘central dogma’ theo quan điểm của Watson-Crick là  thông tin truyền từ DNA–> RNA–> protein. Tới đây Crick nhận thấy một vấn đề là làm sao các amino acids tự do có thể liên kết với carrier RNA (mRNA)? Và ông đưa ra giả thuyết là tồn tại các phân tử làm vai trò cầu nối (adaptor molecule) tuy nhiên ông chưa có câu trả lời. Và thực tế là có tới 20 adaptors (sau này do Zamenik tìm ra đã khẳng định tính đúng đắn của giả thuyết của Crick, và nó được đặt tên là tRNA – transfer RNA) khác nhau, mỗi cái sẽ gắn với mỗi loại amino acid để đem chúng đến ribosome là nơi tổng hợp ra protein.

central_dogma_old

Tóm gọn lại central dogma là như sau:

  • một đoạn DNA tương ứng với một gene sẽ làm template để tạo ra bản sao mRNA, quá trình này gồm nhiều giai đoạn sẽ được đề cập ở một bài riêng. Một enzyme, gọi là RNA polymerase, đóng vai trò tổng hợp ra mRNA  từ DNA template.
  • mRNA (mang thông tin di truyền) sẽ di chuyển ra ngoài nhân (sang tế bào chất) đến gần ribosome là bộ máy tổng hợp protein. Cứ mỗi bộ ba residues trên mRNA sẽ mã hoá cho một amino acids.
  • tRNA đóng vai trò làm adaptor để đọc thông tin các bộ ba trong mRNA để mang các amino acids tương ứng sang ribosomes nhằm tổng hợp protein.

“New” Central Dogma

central_dogma_newGần đây, với sự khám phá ra microRNA (miRNA) đã thay đổi quan điểm truyền thống về central dogma.

miRNA cũng được tổng hợp như mRNA. Tuy nhiên, thay vì được dịch mã (translated) như mRNA để tổng hợp ra protein, miRNA lại tự uốn lại (fold)  để tạo ra một cấu trúc lặp vòng. Lúc đó, miRNA có thể nhắm đến một một mRNA cụ thể và ngăn cản mRNA nó được dịch mã, hay có thể huỷ hoại (degrade) mRNA đó.  Các nghiên cứu gần đây cho thấy vai trò cực kì quan trọng của miRNA trong quá trình phát triển của cơ thể vì nó giúp ngăn ngừa biểu hiện một số gene (gene expression) do những sai sót của quá trình gọi là “leaky transcription“.

PHỤ LỤC1:

Bước 1: từ 1 chuỗi DNA template, RNA polymerase sẽ giúp tổng hợp ra mRNA chứa thông tin di truyền của DNA đó theo qui luật bổ sung

| DNA : mRNA

| A – U

| T – A

| G – C

| C – G

Như vậy, theo qui luật bổ sung (complementary rule), mRNA sẽ là bản sao thông tin di truyền của DNA, mọi thay đổi (mutation) của DNA (nếu có) sẽ được thể hiện trong mRNA. CHÚ Ý: tRNA không chứa thông tin di truyền, nên tRNA không có thay đổi.

Bước 2: mRNA đi ra khỏi nucleus, đến ribosome, tại đó 2 subunits của ribosome sẽ ghép lại và gắn chặt mRNA lại để bắt đầu quá trình tổng hợp proteins. Chú ý là để tổng hợp ra một protein cần các amino acids tự do, các amino acids này sẽ được tRNA đem đến, trật tự liên kết các amino acids này được qui định bởi trật tự các nucleotides bên trong mRNA. rRNA là một thành phần bên trong ribosomes cũng đóng vai trò giúp tổng hợp protein nhưng chức năng cụ thể thì chưa biết rõ.

PHỤ LỤC2:

Xác định ra tRNA

Paul Zamecnik là nhà khoa học nghiên cứu về tổng hợp protein (protein synthesis). Vào thập niên 1950, ông chưa biết về giả thuyết “Central Dogma” và adaptors của Crick. Ông đã tiến hành tổng hợp protein và tiếp cận theo quan điểm sinh hóa (dùng các hợp chất để tổng hợp ra protein). Bằng cách chiết xuất từ tế bào gan của chuột (đó là một dung dịch nước có chứa mọi thành phần từ việc nuôi cấy tế bào). Năm 1953, ông đã chứng minh có thể tổng hợp ra protein từ chiết xuất này trong môi trường ống nghiệm.

Để chứng minh sự tồn tại của các polypeptides, ông cho thêm một loại amino acid có đánh nhãn phóng xạ (radiolabeled) – C14 leucine – vào trong dung dịch. Ông ủ dung dịch (incubate) ở nhiệt độ cơ thể rồi đem vào máy li tâm (centrifuge). Chuỗi (radiolabelled) polypeptide được tạo thành, có chứa các radiolabelled amino acids, nặng hơn và chìm xuống dưới. Còn các amino acids rời, sẽ vẫn nổi ở trên (supernatant).

Ở dưới đáy, trộn lẫn với các radiolabelled polypeptide, Zamecnik còn phát hiện một cấu trúc tế bào khá lớn – mà sau này xác định là ribosome. Ribosome là thành phần tế bào bên trong tế bào chất (cytoplasmic organelle) nơi việc tổng hợp protein xảy ra. Ribosomes được tạo thành từ RNA và proteins. RNA thuộc ribosomes được gọi là rRNA (ribosome RNA) và nó tham gia vào quá trình tổng hợp protein (như đã nói ở trên), nhưng vai trò cụ thể của rRNA lúc đó vẫn chưa được biết.

Mahlon Hoagland, một thành viên trong Lab của Zamecnik, còn phát hiện ra một loại RNA khác – aminoacyltRNA synthetases – trong phần dung dịch của tế bào – nó nhằm hoạt hóa, cung cấp năng lượng cho các amino acids trước khi các amino acids này có thể tham gia vào quá trình hình thành proteins.

Sau đó, năm 1955, Zamenick, Mary StephensenHoagland phát hiện rằng các amino acids sau khi được hoạt hóa sẽ phải gắn vơí một phân tử RNA có trọng lượng thấp (low molecular weight soluble RNA) rồi từ đó mới được đưa đến ribosomes để tổng hợp ra proteins.

Jim Watson, khi ghé thăm lab, đã phát hiện RNA có thể hòa tan trong tế bào chất (soluble RNA) giống với giả thuyết về adaptor của Crick. Mỗi soluble RNA bắt cặp với một đối tác amino acid và đưa amino acid này đến ribosome để tổng hợp ra protein. Soluble RNA sau này được đổi tên lại là tRNA (transfer RNA)

PHỤ LỤC3:

Phát hiện ra mRNA (messenger RNA)

Tới thời điểm này, ta biết cách thức các amino acids được thu thập để có thể liên kết tạo thành proteins. Nhưng trật tự liên kết của các amino acids đó như thế nào? Điều này đã được mã hóa trong gene. Và câu hỏi là genetic code từ DNA được truyền đến ribosome như thế nào?

  • rRNA không phải là ‘template’ để giúp xác định cấu trúc protein (được chứng thực bởi Sydney Brenner, Francois Jacob, và Matthew Meselson)

Họ xác định có một loại RNA thứ 3 (hai RNA đã đề cập là rRNA và tRNA) – một sản phẩm trung gian không tồn tại lâu dài – mang genetic code từ DNA tới ribosome. Để kiểm chứng, họ sử dụng vi khuẩn bị nhiễm phage (phage-infected bacteria) được tạo thành bằng cách: (1) cho vi khuẩn phát triển trong môi trường có đồng vị nặng (heavy isotopes) của carbon và nitrogen (C13N15) để đánh nhãn phóng xạ mọi RNA và protein của vi khuẩn. (2) Sau đó, cho vi khuẩn vào với phage, sau đó chuyển ngay vi khuẩn bị nhiễm phage sang môi trường thiếu đồng vị nặng nhưng vẫn chứa phóng xa (radioactive) P32.

Trước khi phân tách vi khuẩn, họ cho dừng sự phát triển của phage. Và rồi trích xuất RNA và ribosomes ra khỏi vi khuẩn. Đưa phần trích xuất vào máy li tâm có density gradient (mật độ thay đổi) sẽ giúp tách rời nhiều thành phần để giúp phân tích sự phân bố của các đồng vị nặng và nhẹ trong ribosomes, cùng với việc tích hợp của P32 vào trong phage RNA mới tạo ra.

Và ông xác định tồn tại một loại RNA mới được hình thành, do có chứa P32, chính là nơi chứa thông tin di truyền. Và RNA này được gọi là mRNA (messenger RNA).

*** Làm cách nào để mỗi tRNA nhận biết amino acid tương ứng với nó?

PHỤ LỤC4:

Phát hiện ra miRNA (micro RNA)

miRNA (μRNA) là một non-coding RNA (vì nó không dùng để dịch mã thành protein) và đóng vai trò điều chỉnh gene expression. miRNA có chiều dài rất ngắn (21-23 nucleotides) và trước đây chỉ được xem là một “junk” RNA (nghĩa là không có vai trò gì cả). miRNA đầu tiên được tìm ra có tên là lin-4 do Victor Ambros và các đồng nghiệp Rosalind Lee và Rhonda Feinbaum tại Đại học Harvard trong khi đang nghiên cứu sự phát triển của giun (nematode) Caenorhabditis elegans có đột biến.

Sự ra đời của miRNA cho thấy RNA không chỉ làm duy nhất công việc tạo ra protein. Mục đích chính của miRNA là giảm biểu hiện gien (down regulate gene expression). Có nhiều loại miRNA đóng vai trò này. Người ta dự đoán có khoảng 1000 miRNA trong con người, và khoảng 500 trong chúng đã được nhận diện. Thông tin về nó có thể truy cập ở:

  1. http://www.mirbase.org/
  2. http://www.microrna.org/microrna/home.do

Sự tìm thấy miRNA đóng vai trò quan trọng trong quá trình phát triển thuốc (drug development).

TERM:

  • point mutation: đột biến xảy ra tại 1 vị trí của nucleotide trong DNA mà tại đó 1 nucleotide được thay thế bằng 1 nucleotide khác
  • deletion: đột biến xảy ra tại 1 vị trí của nucleotide trong DNA mà tại đó một nucleotide nào đó bị mất đi khỏi DNA
  • Protein: là một chuỗi polypeptide các amino acids được liên kết bằng peptide bonds.
  • leucine: là một trong 8 essential amino acids.
  • phage (hay bacteriophage): là một loại virus sống kí sinh trên vi khuẩn (bacteria), và nó có thể làm chết vi khuẩn
  • polymerase: là một loại enzyme làm nhiệm vụ kết nối các nucleotides lại với nhau dựa trên một chuỗi DNA có sẵn (template). Có 2 loại enzyme polymerase: DNA polymerase RNA polymerase
  • Ribosome là “protein builder” hay “protein synthesizers” của tế bào. Nó có tác dụng kết nối các amino acids rời rạc lại với nhau thành chuỗi polypeptides. Một ribosome không phải chỉ là một piece, nó có 2 phần (pieces hay subunits). Các nhà khoa học gọi 2 đơn vị con này là 60-S (large) và 40-S (small). Hai đơn vị con này chỉ ghép lại, và kết hợp với mRNA, khi cần tạo ra protein. Mô hình 60-S/40-S dùng với eukaryotic cell, còn với prokaryotic cell thì nó là mô hình 50-S/30-S.

SUMMARY:

Central Dogma (luận thuyết trung tâm) là quan điểm cho biết đường đi (pathway) của thông tin di truyền qua đó giúp ta hiểu được quá trình di truyền được diễn ra như thế nào. Việc ra đời và hoàn chỉnh luận thuyết trải qua một thời gian với sự khám phá ra các loại RNA khác nhau (mRNA, miRNA, tRNA, rRNA) tham gia vào quá trình điều tiết biểu hiện gien (gene expression)

References:

  1. http://www.chem4kids.com/files/bio_aminoacid.html (amino acids)
  2. http://www.thenakedscientists.com/forum/index.php?topic=3217.0;prev_next=next (how many amino acids exist?)
  3. http://en.wikipedia.org/wiki/Leucine (leucine amino acid)
  4. http://www.biology4kids.com/files/cell_ribos.html (ribosome)
  5. Lee RC, Feinbaum RL, Ambros V (1993). “The C. elegans heterochronic gene lin-4 encodes small RNAs with antisense complementarity to lin-14”. Cell 75 (5): 843–854.
  6. http://www.pharmaprojects.com/therapy_analysis/microRNA-0808.html

BỔ SUNG:

  1. Transcription
  2. Translation

Written by vietnamen

Tháng Tám 16, 2008 at 3:04 chiều

Di truyền phân tử 6 – half of the DNA is a template to create the whole DNA

leave a comment »

Tại thời điểm này, ta đã biết DNA là cấu trúc xoắn kép, xoắn theo chiều tay phải (B-DNA). B-DNA tạo bởi các monomer là A, T, G, C kết nối theo chiều 5′-3′. DNA nằm trong nhân tế bào và chứa thông tin di truyền (các genes). Câu hỏi đặt ra là: trong quá trình phân bào (mitosis), làm sao để nhân đôi thông tin di truyền để 2 tế bào con đều có cùng thông tin di truyền? –  Dựa vào mỗi quan hệ ghép cặp (A-T, G-C), Watson và Crick đã đưa ra giả thuyết là “mỗi chuỗi trong phân tử DNA đóng vai trò làm mẫu (template) để tạo ra phân tử DNA hoàn chỉnh”.

Năm 1958, có 2 bằng chứng giúp chứng minh giả thuyết này:

  • Phát hiện ra một loại enzyme giúp tổng hợp các nucleotide bổ sung để ghép cặp với các nucleotide ở chuỗi DNA template, gọi là DNA polymerase.
  • Vì mỗi nucleotide có bazơ chứa nỉtogen, một thí nghiệm dùng các đồng vị phóng xa nặng của nitrogen (N15) để theo dõi qúa trình phân chia của DNA đã cho thấy mỗi nửa của phân tử DNA “không thay đổi” và đi về mỗi tế bào con. Chính sự bảo toàn “không thay đổi” này, giúp cho mỗi nữa này có thể tái tạo ra phân tử DNA hoàn chỉnh, nhờ sự trợ giúp của DNA polymerase, và giống với phân tử DNA nguyên gốc từ tế bào mẹ. Cái này được gọi là quá trình nhân đôi bán bảo toàn (semi-conservation replication), do mỗi tế bào con chứa một nửa của phân tử DNA gốc.

DNA_duplicate

Matthew Meselson và Frank Stahl đã chứng minh được rằng phân tử DNA mới là được tạo thành tử phân tử DNA gốc. Họ dùng E.Coli, nuôi cấy trong 3 môi trường:

  1. môi trường 1: chỉ có N15, sau khi E.Coli nhân đôi, N15 được gắn vào các nitrogenous base (A, T, G, C).
  2. môi trường 2: có N15, sau đó nuôi cấy tiếp trong môi trường có N14 (là nitrogen tự nhiên)
  3. môi trường 3: chỉ có N14

Matthew_Stahl_expr

Sau đó, họ thu thành 4 mẫu.

  1. Mẫu 1 là từ môi trường 1, với thời gian đủ 1 lần phân bào.
  2. Mẫu 2 là từ môi trường 2, với thời gian đủ 1 lần phân bào
  3. Mẫu 3 là từ môi trường 2, với thời gian đủ 2 lần phân bào
  4. Mẫu 4 là từ môi trường 3, với thời gian đủ 1 lần phân bào

Tiếp đến, họ kiểm tra thành phần nitrogen trong mỗi mẫu. Để làm vậy, họ tách DNA mỗi mẫu ra và cho vào trong môi trường muối có hàm lượng cao (strong salt solution). Sau đó, họ dùng may li tâm cho các mẫu với tốc độ cao. Lực li tâm sẽ làm các phân tử nặng hơn chìm xuống đáy. Các phân tử nhẹ hơn sẽ nổi ở phíả trên; tạo ra một môi trường có độ muối thay đổi từ dưới lên trên (salt gradient). Kết quả cho thấy, các phân tử ở mẫu 1, do có N15, nên nặng hơn, và chìm sâu hơn các phân tử DNA chỉ có chứa N14, ở mẫu 4. Ở mẫu 2, khi mà phân tử DNA vửa ở trong môi trường có N15 và rồi N14, các phân tử DNA chìm ở mức giữa so với DNA ở mẫu 1 và mẫu 4. Ở mẫu 3, với thời gian ở môi trường N14 gấp đôi, so với mẫu 2, họ quan sát thấy có 2 dải DNA

Matthew_Stahl_expr3

Giải thích:

  1. Mẫu 1: phân tử DNA con tạo ra dùng N15 nên nặng nhất
  2. Mẫu 4: phân tử DNA con tạo ra dùng N14 nên nhẹ nhất
  3. Mẫu 2: phân tử DNA con tạo ra dùng N15. Sau trong môi trường N14, các phân tử DNA con có một nửa của mẹ (chuỗi DNA có N15), và một nửa là chuỗi DNA mới tổng hợp (chỉ có N14) – hybrid molecule. Nên trọng lượng của nó ở lưng chừng so với mẫu 1 và 4
  4. Mẫu 3: phân tử DNA từ mẫu 2, sau khi tiếp tục ở lâu trong môi trường có N14, tiếp tục nhân đôi và lớp các phân tử DNA con được tạo ra từ phân tử mẹ có 1 chuỗi DNA chứa N15 và chuỗi DNA chứa N14. Nên mẫu 3 chửa cả các phân tử DNA chỉ toàn N14, và các phân tử DNA có cả N14 + N15. Kết quả là tạo ra 2 band DNA như hình vẽ.

Tuy nhiên, việc dự đoán về tính bản bảo toàn có thể được xác nhận. Nhưng cơ chế nhân đôi như thế nào, thì vẫn là một ẩn số vào lúc đó. Câu trả lời phải nhờ đến Athur Kornberg. Ông đã chiết xuẩt ra được một enzyme mà ông gọi là DNA polymerase và đưa vào trong môi trường muối, có DNA và các nucleotides cần thiết (A, T, G, C). Mục đích của ông là kiểm tra khả năng nhân đôi của DNA trong môi trường phi tế bào (cell-free system). Ông dùng Thymine (T) đã được đánh dấu phóng xạ (radioactive label) để theo dõi các DNA mới được tạo ra.

Konberg_expr2

Konberg_expr3

Sau khi nuôi cấy ở môi trường nhiệt độ cơ thể (37C), ông quan sát thấy các Thymine được đánh nhãn phóng xạ cùng các nucleotide khác đã tham gia vào quá trình tổng hợp nên các phân tử DNA mới. Đồng thời, khi thử loại bỏ một loại nucleotide ra, ông cũng kết luận rằng, nếu thiếu một trong 4 loại nucleotides, quá trình nhân đôi cũng không thể xảy ra. Khi thử cho DNase, một enzyme đóng vai trò làm đứt gãy chuỗi DNA, vào trong môi trường, thì quá trình nhân đôi cũng không xảy ra. Ông kết luận là quá trình replication cần một template DNA.

Sau này, các nhà khoa học khám ra ra rằng có hơn một loại DNA polymerase. Loại enzyme mà Kornberg khám phá ra, gọi là DNA polymerase I – đóng vai trò chính trong việc sửa chửa DNA. DNA polymerase III – được tìm thấy bởi Tom, con trai của Kornberg, mới đóng vai trò trong việc nhân đôi của DNA trong E.Coli. Loại còn lại, DNA polymerase II (DNA Pol II hay Pol II) là một prokaryotic DNA polymerase đóng vai trò trong việc sửa chửa DNA cho prokaryotes.

TERM:

  • DNA polymerase: là một enzyme đóng vai trò (1) sửa chữa DNA (DNA polymerase III), (2) đóng vai trò sửa chửa DNA (DNA polymerase I, DNA polymerase II)
  • DNA template: một trong 2 chuỗi của phân tử DNA, khi nó đóng vai trò làm mẫu cho quá trình tạo ra phân tử DNA con hoàn chỉnh

SUMMARY:

Quá trình nhân đôi DNA là quá trình semi-conservation replication. Nó cần sự hỗ trợ của một enzyme gọi là DNA polymerase. Có 3 loại DNA polymerase. Các nucleotides tự do trong tế bào, sẽ tham gia vào quá trình hình thành hai chuỗi DNA bổ sung vào 2 chuỗi DNA template.

References:

  1. http://www.dnaftb.org/dnaftb/20/concept/index.html

Written by vietnamen

Tháng Tám 16, 2008 at 3:04 chiều