신경 과학자들은 사람들의 두뇌에서 바로 단어를 읽도록 컴퓨터를 가르치고 있습니다.
과학을 위해 쓴 켈리 서빅 (Kelly Servick)은 이번 주에 프리 프린트 서버 bioRxiv에 게시 된 3 개의 논문에 대해보고했다. 각 연구에서 뇌에 직접 놓인 전극은 신경 활동을 기록하는 반면 뇌 수술 환자는 말을 듣거나 큰 소리로 단어를 읽습니다. 그런 다음 연구자들은 환자의 말이나 말을 알아 내려고 노력했습니다. 각각의 경우에, 연구자들은 뇌의 전기적 활동을 적어도 이해하기 어려운 사운드 파일로 변환 할 수있었습니다.
2018 년 10 월 10 일 bioRxiv에 게시 된 첫 번째 논문은 연구자들이 뇌 수술 중간에 간질 환자에게 음성 녹음을하는 실험을 설명합니다. (실험에서 얻은 신경 기록은 해석하기 위해 매우 상세해야했습니다. 그리고 뇌의 세부적인 수준은 뇌가 공기에 노출되고 뇌 수술과 같이 전극이 직접 노출되는 드문 상황에서만 가능합니다. .)
환자가 소리 파일을 들으면서 연구자들은 소리를 처리하는 뇌의 일부에서 뉴런 발사를 기록했습니다. 과학자들은 뉴런 발사 데이터를 음성으로 바꾸는 여러 가지 방법을 시도했으며 컴퓨터가 감독하지 않은 문제를 해결하려고 시도하는 "딥 러닝"이 가장 효과적이라는 것을 발견했습니다. 그들이 11 명의 청취자 그룹에 대해 인간의 목소리를 합성하는 보코더를 통해 결과를 연주했을 때, 그 개인들은 75 %의 단어를 정확하게 해석 할 수있었습니다.
이 실험에서 오디오를들을 수 있습니다.
2018 년 11 월 27 일 게시 된 두 번째 논문은 뇌종양 제거 수술을받은 사람들의 신경 기록에 의존했습니다. 환자가 단음절로 큰 소리로 글을 읽으면서 연구자들은 참가자의 입에서 나오는 소리와 뇌의 언어 생성 영역에서 발생하는 뉴런을 모두 기록했습니다. 이 연구자들은 컴퓨터를 각 환자에게 심층적으로 교육하는 대신 인공 신경망을 신경 녹음을 오디오로 변환하여 최소한 그 결과가 이해하기 쉽고 마이크로 녹음 한 것과 비슷하다는 것을 보여주었습니다. (이 실험의 오디오는 여기에 있지만 zip 파일로 다운로드해야합니다.)
2018 년 8 월 9 일 게시 된 세 번째 논문은 사람이 말하기로 결정한 특정 단어를 근육 운동으로 변환하는 뇌 부분을 기록하는 데 의존했습니다. 이 실험에 대한 기록은 온라인으로 볼 수 없지만 연구원들은 전체 문장을 재구성 할 수 있으며 (간질 환자의 뇌 수술 중에 기록됨) 문장을 듣는 사람들은 여러 선택을 통해 정확하게 문장을 해석 할 수 있다고보고했습니다. 시간의 83 %를 테스트합니다 (10 개의 선택 중). 이 실험 방법은 단어 전체가 아니라 개별 음절을 만드는 데 관련된 패턴을 식별하는 데 의존했습니다.
이 모든 실험의 목표는 언젠가 (근 위축성 측삭 경화증 또는 이와 유사한 조건으로 인해) 말하는 능력을 상실한 사람들이 컴퓨터 대 두뇌 인터페이스를 통해 말할 수있게하는 것입니다. 그러나 해당 응용 프로그램에 대한 과학은 아직 없습니다.
과학은 단지 연설을 상상하는 사람의 신경 패턴을 해석하는 것이 연설을 듣고 생성하는 사람의 패턴을 해석하는 것보다 더 복잡하다고 과학은보고했다. (그러나 두 번째 논문의 저자는 연설을 상상하는 사람의 뇌 활동을 해석하는 것이 가능할 수 있다고 말했습니다.)
이것들은 작은 연구라는 것을 명심하는 것이 중요합니다. 첫 번째 논문은 단지 5 명의 환자로부터 얻은 데이터에 의존하는 반면, 두 번째 논문은 6 명의 환자와 세 번째 유일한 환자를 조사했습니다. 신경 녹음은 1 시간 이상 지속되지 않았습니다.
여전히 과학은 발전하고 있으며 뇌에 직접 연결된 인공 음성 장치는 어느 시점에서 실제 가능성처럼 보입니다.