Vietnamen’s Weblog

Time, Chances, Diligence, Intelligence: which is the most important?

Di truyền phân tử 9 – determine the gene sequence

with 2 comments

Trong di truyền cổ điển, Mendel mô tả gene là một đơn vị di truyền rời rạc có ảnh hưởng đến tính trạng biểu hiện ra bên ngoài (visible trait hay phenotype). Sau này BeadleTatum định nghĩa lại một gene là một thành phần chứa thông tin hướng dẫn để tạo ra một enzyme (là loại protein đóng vai trò quan trọng trong quá trình trao đổi chất của tế bào). Tuy nhiên, định nghĩa này vẫn chưa hoàn chỉnh. Trong di truyền học hiện đại, quan niệm về gene rõ ràng hơn: đó là một đoạn (segment) trong chuỗi DNA nhằm mã hóa cho một protein, và được bắt đầu bằng một “start” codon (AUG) và kết thúc bằng một “stop” codon (UAG, UGG, hoặc UGA).

Các kĩ thuật phân tích gene đã cho phép con người có những bước tiến lớn trong việc xác định trình tự các chuỗi nucleotides tạo thành một gene cụ thể. Và kĩ thuật phổ biến nhất là “chain termination“, do Fred Sanger phát triển (1977) có sử dụng “defective” DNA nucleotide (~ tức là nucleotide đã bị chỉnh sửa làm mất khả năng kết hợp thêm một nucleotide khác tại 3′-end của nó –> chiều dài của chuỗi DNA bị gián đoán, không hoàn chỉnh về chiều dài), tốt hơn phương pháp trước đó là “Maxam-Gilbert sequencing” technology (1975).

Sanger sequencing

Tạo ra “defective” DNA nucleotide:

Đến thập niên 1970, Sanger đưa ra phương pháp để xác định chính xác trình tự chuỗi nucleotides trong một gene. Phương pháp này dựa trên kết quả của Arthur Kornberg về quá trình tự nhân đôi của DNA (DNA replication) – một DNA strand mới được tổng hợp dựa vào thông tin chuỗi từ một DNA template) nhờ vào enzyme DNA polymerase III để kết nối các nucleotide riêng rẽ. Ví dụ DNA template là một poly-thymine DNA, thì DNA strand mới tạo thành sẽ chứa toàn Adenine (theo nguyên tắc bắt cặp (base-pair): A-T, G-C).

Giải thích hình trên: Trong quá trình hình thành chuỗi  DNA mới, phosphate ở đầu C-5′ của deoxynucleotide triphosphate (dNTP), trong trường hợp này là dATP, tự do đi vào sẽ gắn với đầu C-3′ ở cuối chuỗi mới. Tiếp đến, liên kết ester giữa hai nhóm hydroxyl ở 2 chuỗi (strand) sẽ được tạo ra. Theo cách này, chuỗi nucleotides mới sẽ được nối dài dựa trên thông tin của chuỗi nucleotides làm mẫu (template strand). Phương pháp của Sanger mấu chốt ở việc sử dụng dideoxynucleotides triphosphate (didNTP), ở đây là didATP, với đặc tính hóa học riêng biệt. Cũng như dNTP, didNTP được kết hợp vào chuỗi bằng cách hình thành liên kết phosphodiester tại đầu cuối C-5′. Tuy nhiên, didNTP thiếu một nhóm -OH ở đầu C-3′ cần thiết cho việc hình thành liên kết với nucleotide kế tiếp. Điều này có nghĩa là việc thêm nucleotide mới tiếp vào sau vị trí của didNTP sẽ không thực hiện được, xem hình sau. Dựa vào đó, Sanger thiết lập 4 phản ứng diễn ra tại 4 lọ thí nghiệm riêng biệt – từ đó có thể truy ra thông tin về trật tự liên kết của các nucleotides trong template strand. Mỗi lọ phản ứng gồm: 1 template DNA (giống nhau cho cả 4 lọ), 1 primer ngắn (là chuỗi gồm khoảng 20 nucleotides – đề làm “mồi” cho quá trình gắn kết nucleotide vào tiếp – cũng giống nhau cho cả 4 lọ), DNA polymerase III (chất xúc tác cho quá trình tổng hợp nucleotide strand), và hỗn hợp chứa 4 loại dNTPs tự do – dATP, dGTP, dTTP, dCTP – (trong đó một loại được đánh nhãn phóng xạ hoặc được nhuộm màu huỳnh quang tùy vào lọ, ví dụ: lọ 1 thì có dATP được đánh nhãn phóng xạ, lọ 2 thì có dGTP được đánh nhãn phóng xạ). Sau đó, mỗi loại didNTP – A, T, C, hoặc G – được thêm vào mỗi lọ thí nghiệm độc lập ở trên (ví dụ: lọ 1 thì được thêm didNTP Adenine, lọ 2 thì được thêm didNTP Cytosine…). Với các nguyên liệu nêu trên, quá trình tổng hợp ra nucleotide strand mới sẽ được diễn ra trên mỗi lọ. Nó sẽ dừng lại khi có một didNTP được gắn vào. Do đó, chiều dài của DNA strand mới là ngẫu nhiên và dài ngắn khác nhau ở mỗi lọ phản ứng. Nồng độ (concentration) của didNTP được thêm vào thấp hơn rất nhiều so với các dNTP có sẵn –> giúp đảm bảo là DNA strand tạo ra đủ dài. Lưu ý là phân tử DNA tồn tại ở dạng double strands, do đó để có DNA template, ta cần bẻ gãy liên kết hydrogen bonds (giữa 2 strands). Để tách chúng ra, ta nung bằng nhiệt độ, hydrogen bonds sẽ nhanh chóng đứt gãy, primer sẽ có dịp gắn vào DNA template tương ứng với nó (Chú ý là với một primer xác định, chỉ có 1 strand là có thể làm template). Quá trình phản ứng, lấy lọ 1 là nơi có DNA strand mới kết thúc bằng didATP làm ví dụ. Tại lọ 1: Ban đầu, phân tử double-strand DNA tách thành 2 dải riêng biệt tại gần 100độ (near-boiling temperature). Vì ở nhiệt độ cao, chuyển động động học (kinetic motion) của phân tử DNA giúp phá hủy liên kết hydrogen (liên kết yếu) giúp giữ hai DNA strands với nhau. Khi nhiệt độ giảm lại, primer sẽ gắn vào template DNA theo qui luật bắt cặp (base-pairing). Kornberg đã chứng minh rằng primer là cần thiết để DNA polymerase bắt đầu quá trình replication. Phản ứng tạo DNA strand mới sẽ diễn ra tới khi didNTP Adenine gắn vào thì chuỗi không thể dài thêm được nữa. Quá trình tổng hợp sẽ bị ngắt (terminated) và ta có một chuỗi DNA bổ sung (complement DNA strand) với kích thước bị giới hạn, nên ta gọi là  DNA fragments. Như vậy, tùy thuộc vào thời điểm didNTP Adenine gắn vào, DNA fragments thu được sẽ có chiều dài dài ngắn khác nhau. Trong lọ 1, ở hình vẽ dưới, didATP (màu tím), ở các lần TN khác nhau, ta thu được các DNA fragments với các chiều dài khác nhau.

NOTE: DNA polymerase không phân biệt giữa dNTPs và didNTPs. Bên cạnh các nucleotides bình thường là thành phần của DNA fragment, sẽ có các nucleotide được đánh nhãn phóng xạ. CHÚ Ý: Ở hình vẽ trên, tương ứng với lọ 1, các dNTP Adenine luôn được đánh nhãn phóng xạ. Nên với các dNTP Adenine ban đầu, ta phải hiểu là chúng được đánh nhãn phóng xạ. Kết quả cũng tương tự với 3 lọ còn lại (mỗi lọ sẽ có các DNA fragments mới với nucleotides kết thúc chuỗi tương ứng là didCTP, didTTP, và didGTP).

Xác định trình tự DNA template

Trình tự của chuỗi DNA template có thể xác định gián tiếp thông qua trình tự của chuỗi DNA mới tạo thành, dựa trên nguyên lí bổ sung cho nhau.

Sau quá trình tạo ra “defective” DNA fragment, ta sẽ nung nóng ở mỗi lọ phản ứng nhằm tách DNA fragment mới ra khỏi DNA template. Sau đó, DNA fragment sẽ được đưa riêng rẽ vào một môi trường gọi là polyacrylamide gel (mỗi fragment sẽ được phân cách, nằm trên một làn khác nhau, nhờ có chứa urea giúp ngăn các DNA fragments ở hai lọ khác nhau khỏi gắn kết với nhau trong quá trình điện phân (electrophoresis). Quá trình electrophoresis sẽ giúp 4 strands di chuyển từ cực (-) sang cực (+). Các gốc phosphate bị ion hóa (ionized phosphate – ) làm cho các DNA fragments có điện tích âm. Tùy vào số lượng nucleotides trên mỗi DNA fragments, tổng điện tích âm của 4 strands sẽ khác nhau. Tuỳ vào điện tích mỗi strand, chiều dài di chuyển của chúng cũng khác nhau. Vì thế mỗi DNA fragment sẽ dịch chuyển về cực dương của trường điện từ và dừng lại ở các vị trí khác nhau (với độ phân giải đến 1 nucleotide đơn lẻ – nghĩa là 2 DNA fragments chỉ khác nhau về số lượng 1 nucleotides cũng có thể phân biệt được).

NOTE: Ngoài yếu tố điện tích, yếu tố kích thước cũng ảnh hưởng đến việc dịch chuyển của các DNA fragments qua lưới polyacrylamide (polyacrylamide matrix) – DNA fragments có kích thước nhỏ thì dịch chuyển xa, và ngược lại.

Để theo dõi quá trình dịch chuyển của các DNA fragments, một chất nhuộm màu màu xanh được đưa vào – chúng luôn dịch chuyển nhanh hơn một tí so với DNA fragment nhỏ nhất trong hỗn hợp. Qua quá trình electrophoresis, các DNA fragments ngắn hơn thì dịch chuyển nhanh hơn. Các DNA fragments có cùng kích thước sẽ dịch chuyển về cùng 1 vị trí. Kết thúc quá trình electrophoresis, gel matrix sẽ được chiếu lên tia X và chụp hình lại. Điều này giúp nhận dạng các vị trí của các dNTP được đánh nhãn (nổi lên thành các dải màu đen (black band)). Với lọ 1, nhờ vào Adenine được đánh nhãn phóng xạ tồn tại trong DNA, nó sẽ phát ra hạt beta hiển thị lên phim và cho ta thấy vị trí của các DNA “band” đó trong gel. Tương tự với DNA bands từ các lọ còn lại. Vì đã biết là DNA fragment từ lọ nào nằm ở vi trí nào, nên ta có thể biết là DNA fragment đó có chứa dATP nào được đánh nhãn phóng xạ. Như vậy nếu ở cột 1, có band được hiển thị, thì ta biết đó là dATP được đánh nhãn phóng xạ, và vì cả 3 DNA fragments còn lại cùng với DNA ở cột 1 cũng từ 1 DNA template tạo ra và khởi đầu tại cùng 1 nucleotide, nên chắc chắn là nucleotide ở hàng tương ứng với band được hiển thị đó cũng là dATP (chỉ khác là dATP này không được đánh nhãn phóng xạ nên không nhìn thấy). Dựa vào đó, ta có thể đọc (đi từ dưới lên) để nắm được trình tự nucleotides ở 4 cột dựa vào band ở cột nào mà có đánh nhãn phóng xạ để suy ra nucleotide ở các cột còn lại. Hình ảnh sau sẽ cho ta cái nhìn cụ thể hơn khi mà mỗi band sẽ có ddATP được nhuộm màu khác nhau.

Automated sequencing machine

Công việc xác định trình tự từ các band này rất cần được tự động hóa, và thế là các “automated” sequencing machine ra đời. Vì mỗi chất nhuộm màu có một bước sóng riêng, các máy này sẽ dùng tia laser để xác định bước sóng để từ đó định ra nucleotide tương ứng, và hình ảnh về các đỉnh (peak) của 4 loại bước sóng khác nhau được hiển thị như trong hình vẽ sau (còn gọi là chromatogram — Greek: chromo = color, gram = writing). Mỗi loại nucleotide tương ứng với các peak có độ cao khác nhau. Phương pháp Sanger cho ta mỗi đoạn ngắn (gọi là “read”, “segment”, “fragment”) trong khoảng 500-1000pbs. Và các máy tự động đọc chiều dài của fragment mỗi lần là khoảng 200-500 bps (base pairs) và gần đây là 900 bps.

TEST

1. Để kiểm tra cách đọc, ta có thể dựa vào hình vẽ bên và cho biết chuỗi nucleotide nào trong 4 lựa chọn trên là đúng với chuỗi 20 nucleotides đầu tiên của DNA fragment.

2. Kết quả thu được là trình tự đọc theo chiều 5′ –> 3′ của DNA fragment, vậy, trình từ 3′ –> 5′ của complement DNA template là gì? 3. Nếu mRNA được tổng hợp từ complement DNA template này theo chiều 3′–>5′, vậy chuỗi nucleotide của mRNA theo chiều 5′–>3′ là gì?

NOTE: Fred Sanger cũng là người đầu tiên xác định được trình tự amino acids trong một protein (1950s). Đó là insulin protein với 51 amino acids. Tuy nhiên, điều này không cho phép ta xác định được trình tự của nucleotides mã hóa cho insulin protein (lí do đã đề cập trong phần trước – nhiều codons có thể mã hóa cho cùng một nucleotide).

Next-generation sequencing technology

Hiện nay, người ta thường nhắc đến một kĩ thuật mới giúp tăng khả năng xác định trình tự lên high throughput, và chi phí thấp gọi là “next-generation sequencing technology” với chiều dài các “reads” ngắn hơn, gọi là “short-reads”, vào khoảng 80-100bps thậm chí 20-30bps.

TERMS

  • gene: tại thời điểm này, quan điểm về gene đã được cập nhật, đó là một phân đoạn trong chuỗi vô cùng lớn DNA. Gene mã hóa cho một protein. Đơn vị cấu trúc của protein là nucleic acid (ta đã đề cập). Ta biết là có 20 loại nucleic acids đóng vai trò cấu thành một protein (CHÚ Ý: nếu không bắt buộc là đơn vị cấu thành ban đầu một protein, thì số lượng nucleic acids rất nhiều – khoảng 100). Gene gồm các nucleotides (có 4 loại nucleotides, trong RNA thì kí hiệu là  A, U, G, C – ta đã tìm hiểu trong phần central dogma), nên cứ mỗi bộ 3 nucleotides sẽ mã hóa cho một nucleic acids (xem phần DNA words). Ta gọi bộ ba này là một codon. Condon đánh dấu bắt đầu một gene là “start” codon: AUG, và codon đánh dấu kết thúc một gene là “stop” codon (có 3 lựa chọn): UAG, UGG, UGA.
  • electrophoresis: là kĩ thuật phân tách các phân tử dựa vào tính chất vật lí là khối lượng, kích thước, và đích tích của chúng.
  • chromatogram: sắc phổ kí

SUMMARY:

LINKS:

  1. http://www.genomenewsnetwork.org/resources/timeline/1977_Gilbert.php
  2. http://en.wikipedia.org/wiki/DNA_sequencing
  3. http://www.bio.davidson.edu/Courses/Molbio/MolStudents/spring2003/Obenrader/sanger_method_page.htm

ANSWER: 1. Chuỗi thứ nhì.

Một số hình ảnh minh hoạ cho chromatogram

Written by vietnamen

Tháng Tám 16, 2008 lúc 3:08 chiều

2 phản hồi

Subscribe to comments with RSS.

  1. Chào anh ! Rất vui được làm quen với anh ! Thật vui vì có người chuyên môn sinh mà lại giỏi tin học như anh !

    Mặc dù là một giáo viên cấp III nhưng tôi có tham vọng có thể đọc hiểu tiếng anh chuyên ngành và muốn biến tin học trở thành công cụ dạy và học.

    Bài này rất hữu ích cho tôi dùng để dạy học sinh giỏi ! Cám ơn anh nhiều !

    Tôi có trang http://sinhhoc.org, mời anh ghé chơi ! Hy vọng sau này anh có thể giúp đỡ tôi một chút trong việc tiếp thu tiếng anh chuyên ngành !

    TOBU

    Tháng Chín 25, 2008 at 2:37 chiều

  2. @TOBU
    Hi anh, mình rất vui được anh ghé qua. Mong anh sẽ đóng góp ý kiến để mình chỉnh sửa nội dung chính xác hơn. Nếu cần trao đổi trực tiếp, anh có thể liên lạc qua vietman82@yahoo.com.vn
    PS: Chuyên môn chính của mình là CS, chứ không phải biology. Nên thiếu sót trong phần tổng hợp kiên thức là không tránh khỏi, mong bạn đóng góp thêm.

    vietnamen

    Tháng Mười 28, 2008 at 2:15 chiều


Gửi phản hồi

Mời bạn điền thông tin vào ô dưới đây hoặc kích vào một biểu tượng để đăng nhập:

WordPress.com Logo

Bạn đang bình luận bằng tài khoản WordPress.com Log Out / Thay đổi )

Twitter picture

Bạn đang bình luận bằng tài khoản Twitter Log Out / Thay đổi )

Facebook photo

Bạn đang bình luận bằng tài khoản Facebook Log Out / Thay đổi )

Google+ photo

Bạn đang bình luận bằng tài khoản Google+ Log Out / Thay đổi )

Connecting to %s

%d bloggers like this: