Công Nghệ

Microsoft Excel vừa khiến cả ngành di truyền học rơi vào ‘khủng hoảng’, buộc phải họp gấp để tìm phương án giải quyết

Có hàng chục nghìn mã gen trong bộ gen của con người: Những đoạn xoắn cực nhỏ của ADN và ARN kết hợp với nhau tạo nên những đặc điểm đặc tính làm cho mỗi người trở nên độc nhất. Đặc biệt, mỗi mã gen đều được các nhà khoa học đặt tên và chữ số, được gọi là ký hiệu, nhằm giúp quá trình nghiên cứu gen trở nên thuận tiện hơn.

Tuy nhiên, trong khoảng hơn một năm trở lại đây, các nhà khoa học đã buộc phải đổi tên 27 mã gen của con người. Nguyên nhân là do phần mềm Microsoft Excel liên tục…nhầm những ký hiệu này thành định dạng ngày tháng trong quá trình nhập liệu vào phần mềm, theo The Verge.

Microsoft Excel vừa khiến cả ngành di truyền học rơi vào khủng hoảng, buộc phải họp gấp để tìm phương án giải quyết - Ảnh 1.

Là một trong những ứng dụng bảng tính phổ biến đối với dân văn phòng, Excel thường được các nhà khoa học sử dụng thường xuyên để theo dõi công việc, cũng như lưu lại số liệu các đợt thử nghiệm lâm sàng.

Tuy nhiên, do thiết lập mặc định của Exel được tinh chỉnh để có thể phù hợp với đối tượng người dùng văn phòng, tên mã gen khi nhập vào phần mềm này đều bị sai lệch. Cụ thể, khi các nhà khoa học nhập vào ký hiệu MARCH1 (viết tắt của mã gen Membrane Associated Ring-CH-Type Finger 1), Excel sẽ tự động chuyển nó thành ngày 1 tháng 3 (1-Mar).

Microsoft Excel vừa khiến cả ngành di truyền học rơi vào khủng hoảng, buộc phải họp gấp để tìm phương án giải quyết - Ảnh 2.

Chính lỗi này của Excel đã khiến không ít nhà khoa học cảm thấy đau đầu. Việc dữ liệu khi nhập vào bị sai lệch buộc các nhà khoa học phải lần lượt chỉnh sửa lại bằng tay. Một nghiên cứu từ năm 2016 cho thấy, khoảng 1/5 trong tổng số 3597 bài nghiên cứu về gen được công bố tồn tại lỗi gây ra bởi Excel. 

Nhóm nhà nghiên cứu Australia đã phân tích gần 3 600 bài báo di truyền đăng trên một số tạp chí khoa học uy tín như Nature, Science và PLos One. Trong lĩnh vực này, tất cả các bài báo đều có phụ lục với danh sách các gen được sử dụng trong nghiên cứu.

Các nhà nghiên cứu Úc phát hiện ra rằng khoảng 1/5 số bài báo có các sai sót trong danh sách gen do Excel tự động chuyển đổi tên gen sang ngày tháng hoặc số ngẫu nhiên.

“Nó thực sự, thực sự khó chịu”, Dezső Módos – một nhà sinh học hệ thống tại Viện Quadram ở Anh cho biết. Với công việc chính là phân tích trình tự gen, nhà sinh học này thường xuyên sử dụng Excel để xử lý các dữ liệu dạng số. “Exel là một phần mềm cực kỳ thông dụng, nếu bạn không am hiểu quá nhiều về máy tính thì bạn sẽ sử dụng nó”.

Đáng chú ý, việc khắc phục lỗi trên của Excel cũng không hề đơn giản. Về cơ bản, Excel không cung cấp tùy chọn để tắt tính năng tự động định dạng (auto-formating). Do vậy, người dùng buộc phải tự mình tinh chỉnh lại định dạng ngày-tháng-năm ở từng cột riêng lẻ trong bảng tính – một công việc tốn khá nhiều thời gian và công sức, đặc biệt với những bảng Excel có lượng dữ liệu lớn. 

Đáng nói, ngay sau khi một nhà khoa học vừa khắc phục xong lỗi, bản thân các lỗi này sẽ lại tự động xuất hiện một lần nữa khi người khác mở cùng một bảng tính Excel đó trên một máy tính khác.

Cuối cùng, cơ quan khoa học phụ trách tiêu chuẩn hóa tên của các mã gen, gọi tắt là HGNC mới đây đã buộc phải công bố quy ước mới về cách đặt tên các mã gen nhằm tránh những sai sót có thể xảy ra bởi Excel. Theo đó, ký hiệu MARCH1 đã thành MARCHF1, trong khi SEPT1 đã  thành SEPTIN1. Thậm chí một số tên mã có thể gây nhầm lẫn với những từ phổ biến cũng được đổi tên, như WARS thành WARS1, CARS thành CARS1.

Tham khảo The Verge

Leave a Reply

Bài viết cùng chuyên mục

Back to top button
Vui lòng đăng nhập để gửi báo cáo
Vui lòng đăng nhập để tặng điểm cho tác giả