Siêu máy tính Cray XC30 giúp xây dựng bộ gen con người trong 9 phút

  • 84

Với sự trợ giúp của siêu máy tính, các nhà khoa học đã có thể rút ngắn thời gian xây dựng hệ gen sinh học đi rất nhiều.

Siêu máy tính Watson giúp tổng hợp các thông tin bệnh án nhanh hơnSo sánh não bộ con người với siêu máy tínhKỷ lục mới của siêu máy tínhSiêu máy tính xây dựng bộ gen con người trong 9 phút

Một nhóm thành viên tại viện Joint Genome - trực thuộc phòng thí nghiệm quốc gia Lawrence Barkeley, cùng các nhà nghiên cứu của trường đại học California Barkeley mới đây đã sử dụng 15.000 nhân của siêu máy tính Cray XC30 “Edison” nhằm rút ngắn việc xây dựng toàn bộ hệ gen của con người. Tổng thời gian để các siêu máy tính Edison thực hiện việc này là 8 phút 24 giây.

Các siêu máy tính hiện nay đóng vai trò khá quan trọng trong việc rút ngắn thời gian thực hiện những nghiên cứu khoa học quy mô lớn. Đối với nghiên cứu gen, thành tựu trên mở ra nhiều khả năng hơn so với việc dựng hệ gen bằng các công cụ lắp ráp “de novo” như trước đây. Chẳng hạn như với công cụ “de novo”, giải đoạn mã Meraculous tiêu tốn gần 24 giờ. Việc dựng hệ gen hoàn chỉnh của cây lúa mì - vốn vô cùng phức tạp – gần như nằm ngoài khả năng của công cụ này. Nhưng với phương pháp HipMer, dưới sự trợ giúp của siêu máy tính 15.000 nhân, hệ gen của cây lúa mì được dựng nên chỉ trong vòng chưa đầy 40 phút.

Siêu máy tính Cray XC30 giúp xây dựng bộ gen con người trong 9 phút
Siêu máy tính ngày càng đóng vai trò quan trọng trong nghiên cứu khoa học

Nhóm nghiên cứu cho biết, tuy phương pháp “de novo” có lợi thế từ việc “tìm ra những tổ hợp gen mới có thể đã bị bỏ sót”, nhưng thời gian mà phương pháp này cần để thực hiện công việc lại lớn hơn rất nhiều so với các công cụ lắp ráp hiện đại.

Phương pháp mới được áp dụng mang tên HipMer (viết tắt của High performance Meraculous) có thể giúp các nhà khoa học giải quyết được vấn đề nan giải trước đây – Xử lý một lượng lớn dữ liệu và giải quyết những thuật toán vô cùng phức tạp.

“Lần đầu tiên trong lịch sử, chúng tôi đã có thể vượt qua khả năng của toàn bộ những thiết bị dựng tổ hợp gen trên thế giới, và mở ra một kỷ nguyên mới cho ngành nghiên cứu hệ gen. Phương pháp mới kết hợp giữa việc xác định trình tự hiệu quả cao, đồng thời cũng có được tính chi tiết và đầy đủ của phương pháp de novo. Bằng cách này, chúng tôi tin sẽ tạo nên tiền để cho những phát triển của công nghệ y sinh trong tương lai, bao gồm cả việc đảm bảo an ninh lương thực lẫn việc điều chế những loại thuốc dùng cho cá nhân.”

Siêu máy tính Edison được thiết kế từ một năm trước với mục đích hỗ trợ các nhà khoa học thực hiện các nghiên cứu về hệ gen. Bởi vậy, “Edison” có khả năng cân bằng giữa việc xử lý một khối lượng lớn dữ liệu, cũng như đáp ứng được những công việc cần đến bộ vi xử lý nhiêu nhân. Khi các thành viên NERSC làm việc với Cray để phát triển chiếc XC30 dùng trong nghiên cứu, ngoài khả năng liên kết giữa số lượng lớn bộ vi xử lý, họ còn muốn có được một bộ nhớ với lưu lượng băng thông lớn. Kết quả, một siêu máy tính với tốc độ truy xuất dữ liệu khoảng 163 gigabyte trên giây và rơi vào khoảng 2,4 petaflop.

Siêu máy tính Cray XC30 giúp xây dựng bộ gen con người trong 9 phút
Thời gian dựng hệ gen bằng phương pháp HipMer

Đối với siêu máy tính, bộ vi xử lý và băng thông bộ nhớ là hai điểm tối quan trọng. Tuy nhiên, việc xây dựng bộ mã để có thể phân bố hiệu quả công việc giữa 15.000 bộ vi xử lý Ivy Bridge 12 nhân cũng quan trọng không kém. Siêu máy tính Edison được gây dựng trên nền tảng từ công cụ tổ hợp gen Meraculous – hiện được cho là công cụ tối ưu nhất sử dụng phương pháp "de novo".

Phương pháp HipMer có nhiều tiến bộ như sử dụng nhiều thuật toán nhằm tối ưu hóa hiệu quả của UPC, cải thiện tốc độ truy xuất, cũng như thực hiện song song các công đoạn phức tạp cùng một lúc. Đồng thời việc đọc và ghi dữ liệu từ một số lượng lớn đồng thời từ các bộ vi xử lý cũng được thực hiện tốt hơn.

Nhóm nghiên cứu cũng đang phát triển thêm phương pháp phân bổ bộ nhớ khác cho HipMer, mà khi thành công sẽ rút ngắn được bộ mã gen đầy đủ của lúa mì trong chưa đầy 11 phút. Giai đoạn tiếp theo nhóm nghiên cứu hướng đến là áp dụng phương pháp này vào nghiên cứu hệ gen ở quy mô lớn hơn.