Dự án nghiên cứu Gen của con người Việt

gen 1024x683 - Dự án nghiên cứu Gen của con người Việt

“Nghiên cứu về bộ gen của người Việt” là cơ sở dữ liệu đồ sộ đầu tiên về hệ gen người Việt Nam, được thực hiện từ việc giải trình tự bộ gen của 305 người Kinh khỏe mạnh tại Vinmec; đồng thời, kết hợp với dữ liệu của 101 người đã được công bố trước đó.

Kết quả nghiên cứu công bố hơn 24 triệu điểm biến đổi, trong đó có hơn 700 nghìn điểm mới hoàn toàn. Theo đó, hệ gen người Việt có sự khác biệt so với hệ gen các quần thể người khác thể hiện qua sự khác biệt lớn về tần suất xuất hiện của nhiều biến đổi di truyền. Cụ thể, công trình phát hiện 1,24 triệu biến đổi xuất hiện phổ biến ở người Kinh, nhưng xuất hiện rất ít ở các quần thể người khác. Đây là đóng góp quan trọng, cung cấp cơ sở tham chiếu có độ tin cậy cao cho các nghiên cứu, ứng dụng Y – Sinh tiếp theo về sức khỏe người Việt có liên quan đến hệ gen.

Các phân tích về hệ gen người Việt được công bố thể hiện sự khác biệt của người Kinh đối với các quần thể người khác. So sánh với cơ sở dữ liệu 1000 hệ gen người, khoảng 1/3 số lượng biến đổi di truyền ở quần thể người Kinh không xuất hiện trong quần thể người Hán và ngược lại. Đặc biệt, kết quả phân tích nguồn gốc tổ tiên của các quần thể người cho thấy người Đông Nam Á hiện tại, bao gồm người Kinh Việt Nam có nguồn gốc chính từ người Đông Nam Á cổ đại. Các dữ liệu cũng khẳng định người Kinh và người Thái có hệ gen tương đồng cao và quan hệ tiến hóa gần gũi. Trong khi đó, sự giao thoa và dịch chuyển gen từ các quần thể người Đông Á đến quần thể người Kinh Việt Nam là không đáng kể.

Đối với các nhà khảo cổ học, lịch sử và di truyền học, thông tin mới về hệ gen của người Việt là cơ sở để có thể nghiên cứu tiếp về nguồn gốc của người Việt trong tương quan với các dân tộc khác trong khu vực. Đồng thời, dữ liệu từ công trình nghiên cứu cũng góp phần củng cố giả thuyết khoa học về việc con người từ châu Phi đến định cư tại các nước Đông Nam Á, sau đó mới di cư sâu vào lục địa theo hướng từ phía Nam lên phía Bắc.

Nghiên cứu được thực hiện độc lập tại VRISG trong vòng 27 tháng từ tháng 12/2016 – 3/2019. Công trình sử dụng công nghệ giải trình tự toàn bộ hệ gen trên Hệ thống máy giải trình tự hiện đại nhất của hãng Illumina, Mỹ (Hiseq 4000) cho kết quả chính xác với độ sâu và bao phủ lớn các thông tin trên hệ gen. 

Cơ sở dữ liệu hệ gen người Việt này được coi là cuốn từ điển đầy đủ nhất tra cứu về hệ thống dữ liệu gen người Việt tính đến thời điểm hiện tại. Trước đó, các nhà khoa học trong nước thường phải tham chiếu bộ gen từ quần thể người nước ngoài.