Nếu bạn hay theo dõi tin tức công nghệ, chắc hẳn sẽ còn nhớ Pindrop Security, một công ty bảo mật ở Mỹ, vào năm 2013 đã giới thiệu một công nghệ phân tích âm thanh giúp người dùng nhận diện cuộc gọi từ những kẻ lừa đảo. Công nghệ mới này sẽ giúp nhận diện ngữ âm, xác định tính vùng miền của giọng nói, nhận diện tiếng động môi trường, đặc điểm tần số âm thanh đường dây điện thoại của mỗi quốc gia…
Công nghệ đặc biệt hữu dụng này hứa hẹn trong tương lai sẽ cho phép chúng ta mở khóa xe hoặc mở khóa điện thoại bằng giọng nói.
Theo Fastcompany, trong tương lai gần, bạn sẽ có thể mở khóa chiếc ô tô yêu quý của mình, hay thậm chí là đăng nhập vào tài khoản trên ứng dụng trực tuyến yêu thích của bạn ở bất kỳ đâu (quán net chẳng hạn) bằng giọng nói của chính bạn.
Cũng giống như dấu vân tay, giọng nói của bạn là duy nhất. Có rất nhiều yếu tố cấu thành giọng nói của bạn: âm lượng, thói quen, vùng miền, vòm họng, v.v… tạo nên cho bạn một giọng nói đặc biệt và không có giọng nói nào giống hoàn toàn cả.
Pindrop, một công ty bảo mật chuyên cung cấp các công cụ phát hiện các cuộc gọi gian lận giọng nói cho các tổng đài, đang lên kế hoạch đưa ra dịch vụ đặc biệt vào cuối năm nay. Dịch vụ này sẽ cho phép các thiết bị được kết nối có thể xác thực qua giọng nói, biến giọng nói con người trở thành một sự kết hợp giữa tên người dùng và mật khẩu.
Theo Vijay A. Balasubramaniyan – người đồng sáng lập và là CEO của Pindrop; "Giọng nói của mỗi người là độc nhất vô nhị, và mỗi con người đều có những thói quen nói chuyện của riêng họ".
Balasubramaniyan cho biết thêm, bảo mật đăng nhập bằng giọng nói sẽ giúp cho việc thực hiện các giao dịch phức tạp qua mạng hoặc qua các "thư ký số" (như Siri của Apple hay Alexa của Amazon) trở nên an toàn hơn, và giúp ngăn chặn việc tiếng quảng cáo TV quá to hay tiếng trẻ em đùa nghịch vô tình "giúp" đặt mua hàng hóa qua những ứng dụng này. Và nếu các thiết bị được thông với nhau qua Pindrop hoặc qua các nhà cung cấp bảo mật giọng nói khác, người dùng sẽ không cần các thiết bị riêng lẻ để có thể nhận ra giọng nói của mình. Họ có thể dễ dàng đăng nhập tài khoản của mình ở một thiết bị hoàn toàn mới chỉ bằng việc nói.
Công nghệ này cũng có thể phát hiện ra nếu con người cố tình giả giọng, làm méo giọng của mình hay cố "đánh lừa" bằng cách phát bản ghi âm giọng nói của người khác. Balasubramaniyan cho biết hiện nay công nghệ chống lừa đảo thông qua phát hiện giọng nói đã được đưa vào sử dụng tại các tổng đài. Theo báo cáo của Pindrop, công ty đã làm việc với 8/10 ngân hàng hàng đầu ở Mỹ và 2/5 công ty bảo hiểm hàng đầu trong việc phát hiện gian lận giọng nói qua điện thoại. Các tổng đài trả tiền dựa trên số lượng các cuộc gọi, và Pindrop cũng có thể đưa ra cấu trúc chi phí tương tự cho nhà sản xuất thiết bị IoT (Internet of Things).
Để phát hiện gian lận giọng nói qua điện thoại, hệ thống Pindrop không chỉ nghe giọng nói của người gọi khi họ đặt đơn hàng hay thanh toán/chuyển khoản, mà còn sử dụng các nguồn dữ liệu âm thanh khác để xác định người gọi đang gọi đến từ đâu, loại điện thoại và nhà mạng họ sử dụng là gì. Loại và đời của điện thoại cũng giúp đánh dấu các đặc điểm âm thanh riêng của họ trong cuộc trò chuyện. Trên thực tế, mạng điện thoại ở nhiều nơi trên thế giới sẽ truyền các dải tần số âm thanh khác nhau dựa trên các yêu cầu khác nhau để cân bằng lượng tiêu thụ băng thông và chất lượng âm thanh. Ngay cả với công cụ gọi điện của Internet, ví dụ như Skype hay Google Voice, cuộc trò chuyện sẽ được chia nhỏ ra thành các "gói âm thanh" với các kích thước khác nhau để các thuật toán của Pindrop có thể phân biệt được.
Balasubramaniyan nói rằng "Bất cứ khi nào bạn trò chuyện, bạn sẽ có thời gian nghỉ khoảng 30 phần nghìn giây hoặc 20 phần nghìn giây, hoặc có thể là bất kỳ con số nào khác".
Với công nghệ này, các công ty bảo mật như Pindrop sẽ cảnh báo khách hàng của mình khi họ có cuộc gọi lạ, ví dụ như một số điện thoại đăng ký ở Mỹ đang thực hiện cuộc gọi qua Skype hoặc qua nhà mạng nào đó ở Nigeria. Trong các trường hợp khác, công ty đã phát hiện ra các cuộc gọi có vẻ từ nhiều khách hàng và nhiều số khác nhau nhưng có cùng tín hiệu lừa đảo. Công ty phân tích 147 đặc điểm khác nhau có thể giúp xác định sự độc đáo của một thiết bị và gắn nó với người gọi. "Mỗi thiết bị điện thoại phát ra một tín hiệu âm thanh rất đặc biệt khi cuộc gọi được thực hiện" - Balasubramaniyan cho biết.
"Chúng ta sẽ nhận ra, ví dụ như có một trăm cuộc gọi để tiếp cận một trăm tài khoản, nhưng chúng đều có 147 đặc điểm giống hệt nhau, và chúng được thực hiện ở cùng một thiết bị" – ông giải thích.
Pindrop tạo ra các cấp độ số và cấp độ màu cho các mức cảnh báo dành cho khách hàng của mình, giúp họ có thể phục vụ các khách hàng gọi điện đáng tin cậy một cách nhanh chóng và tiếp nhận, xử lý các cuộc gọi có dấu hiệu mạo danh một cách thận trọng hơn. Trong các trường hợp xuất hiện cảnh báo giả mạo, họ có thể sẽ hỏi thêm một số câu hỏi nhằm xác nhận thêm thông tin từ các cuộc gọi bất thường hoặc thậm chí là đề nghị gọi lại vào số cá nhân của họ trong hồ sơ. Một số khách hàng khác chỉ sử dụng thông tin cảnh báo của Pindrop để tra cứu, kiếm tra và xem xét quyết định có nên chấp nhận các giao dịch (ví dụ như giao dịch chuyển tiền qua mạng) hay không dựa trên mức độ cảnh báo được hiển thị.
Có một thực tế đáng buồn rằng những kẻ lừa đảo đang ngày càng tiếp cận và sử dụng các công nghệ mới với nhiều thủ đoạn tinh vi, nhưng Balasubramaniyan khẳng định Pindrop cũng thường có thể ứng phó và bắt kịp những thủ thuật và hành vi mới của chúng – giống như các cuộc gọi định tuyến thông qua hệ thống điện thoại bị hack tại các quốc gia ít bị nghi ngờ. "Nó khác rất nhiều so với các cuộc gọi thông thường" – ông cho biết.
Công ty cũng có thể phát hiện được các tội phạm đang cố gắng kết nối từ thiết bị mới dựa trên lịch sử thói quen ngôn ngữ và dữ liệu giọng nói của họ. Balasubramaniyan khẳng định: "Chúng tôi đã tạo ra cơ sở dữ liệu lớn nhất thế giới về giọng nói của những kẻ lừa đảo nổi tiếng".
Công ty thậm chí còn mở riêng một tổng đài của riêng họ. Họ mua từ các hãng tàu sân bay số điện thoại của những khách hàng đã từng giao dịch (do có quá nhiều các cuộc gọi lừa đảo ở các hãng này). Hệ thống Pindrop đã nhận được khoảng 90.000 cuộc gọi lừa đảo mỗi ngày từ các số trên, thông thường chỉ bật một đoạn ghi âm của các đoạn nói ngắn như "Tôi có thể nghe giọng bạn rất rõ" – đủ dài để khiến người gọi phải giữ máy để nhận diện kết nối của họ.
Tất cả các dữ liệu về giọng nói của con người mà công ty đã lưu lại sẽ được sử dụng để tạo ra các sản phẩm IoT – những sản phẩm kết nối hoàn toàn qua internet – có khả năng phát hiện và chống gian lận một cách hiệu quả nhất.
"Chúng tôi biết có nhiều trường hợp con người tự làm méo giọng của mình. Nếu có thể biết được giọng nói sẽ biến đổi như thế nào từ một nguồn cơ sở dữ liệu đủ lớn, chúng ta sẽ có thể giải được vấn đề này tốt hơn".
Công nghệ đang ngày càng phát triển. Trong thời gian sắp tới, với công nghệ nhận biết và phân tích giọng nói con người, chúng ta thậm chí không cần nhập những dòng mật khẩu dài ngoằng, nhập những dòng captcha khó phân biệt. Tất cả việc chúng ta cần làm là nói. Hãy cùng chờ đợi công nghệ nhận biết lừa đảo qua giọng nói phát triển đến thời kỳ chìn muồi, và chúng ta sẽ có thể an tâm sử dụng internet với sự bảo mật tuyệt đối an toàn.