Báo chí Ả Rập vốn có tiếng ngoan ngoãn, biết cách lấy lòng những dòng chính thống. Ví dụ ngày nào đó, bạn có thể đọc được điều này trên báo “một nguồn gần Bộ Ngoại giao Iran nói với Al-Hayat rằng” Tehran sẽ tiếp tục tuân theo các điều khoản của thỏa thuận hạt nhân miễn là phía bên kia cũng làm như vậy. “Nhưng điều đặc biệt về câu chuyện không này là, nhờ Google, những độc giả nói tiếng Anh giờ đây có thể đọc được điều này trong các báo Arab.
Trong vài tháng qua, các công cụ dịch thuật trực tuyến miễn phí đã đột nhiên trở nên tốt hơn nhiều. Điều này có thể gây ngạc nhiên cho những người đã cố gắng sử dụng chúng trong quá khứ. Nhưng vào tháng 11, Google đã công bố một phiên bản Dịch mới. Phiên bản cũ, được gọi là “cụm từ” dịch máy, đã làm việc trên mỗi câu riêng biệt, với một kết quả thường không chính xác.
Phiên bản mới vẫn gây lỗi, nhưng hiện nay chúng đã tương đối ít hơn. Nó sử dụng một mạng thần kinh nhân tạo, liên kết các “nơ-ron” số trong một vài lớp, mỗi lớp cung cấp năng lượng cho lớp tiếp theo, theo một cách tiếp cận mô phỏng lỏng lẻo trên bộ não con người. Các hệ thống dịch giống như các hệ thống dựa trên cụm từ trước chúng, lần đầu tiên được “đào tạo” bởi khối lượng lớn các văn bản được dịch bởi con người. Nhưng phiên bản thần kinh lấy từng từ và sử dụng ngữ cảnh xung quanh để biến nó thành một dạng đại diện số học trừu tượng. Sau đó, nó cố gắng để tìm thấy các đại diện phù hợp nhất trong ngôn ngữ mục tiêu, dựa trên những gì nó đã học được từ trước. Máy dịch thần kinh xử lý các câu dài hơn nhiều so với các phiên bản trước.
Những lỗi này có thể dự đoán trước được khi các lập trình viên cải tiến hệ thống. Nhưng một số “sai lầm” từ hệ thống dịch thần kinh có vẻ bí ẩn. Người dùng thấy rằng gõ các ký tự ngẫu nhiên bằng các ngôn ngữ như tiếng Thái, kết quả trong Google tạo ra những bản dịch lạ kỳ như: “There are six sparks in the sky, each with six spheres. The sphere of the sphere is the sphere of the sphere”
Mặc dù điều này có thể khiến một số nhà thơ hậu hiện đại bị ngưng hoạt động nhưng các hệ thống dịch thần kinh vẫn chưa sẵn sàng để thay thế con người bất cứ lúc nào. Văn học đòi hỏi quá dè dặt một sự hiểu biết về ý định và văn hoá của tác giả đối với máy móc để làm việc. Và đối với các lỗi kỹ thuật, tài chính hoặc pháp lý, những sai lầm nhỏ (kể cả những hệ thống tốt nhất vẫn còn nhiều) là không thể chấp nhận; Vẫn cần có con người để chỉnh sửa những lỗi phát sinh của bản dịch tự động.
Công cụ dịch thuật trực tuyến mang lại lợi ích to lớn cho toàn cầu tò mò. Nhiều người đã mong đợi những gì các nền văn hoá khác đang đọc và nói về, nhưng không có thời gian để học các ngôn ngữ. Mặc dù vẫn tìm được bàn chân của mình, thế hệ phần mềm dịch thuật mới vẫn còn hứa hẹn sẽ làm được điều đó.