
인공지능, ‘프리즘 테스트’에서 인간에 맞먹다
2025-04-07
저자: 하준
최근 인공지능이 사람과 비슷하게 대화할 수 있는지를 평가하는 새로운 테스트인 '프리즘 테스트'를 통과했다는 소식이 전해졌다.
미국 샌디에고에 위치한 캘리포니아 대학교 샌디에고 캠퍼스(UCSD) 연구팀이 4개 지능형 인공지능 모델을 비교 분석하기 위해 프리즘 테스트를 진행했으며, 결과적으로 가장 진보한 모델인 'GPT 4.5'가 인간과의 대화에서 뛰어난 성과를 거둔 것으로 나타났다. 연구진은 이 AI가 감정 표현과 사회적 상호작용에서 특히 '사람 같다'라는 평을 받았다고 전했다.
이 테스트는 최근 2개월간 진행되었으며, AI 모델은 다양한 대화 주제에 대한 응답을 제공했다. 특히, 사용자가 느낀 감정을 이해하고 적절한 반응을 보이는 능력에서 GPT 4.5가 두각을 나타냈다.
역사적으로 인공지능의 대화 능력은 1960년대 초기 모델인 ELIZA와 GPT-4o와 같은 대화형 AI에 이르기까지 지속적으로 발전해왔으며, 최근 2020년대에 들어서는 LLM(대규모 언어 모델) 기술이 이 끊임없는 진화를 이끌고 있다.
그 외에도 GTP-4.5는 1950년대의 AI 모델들과 비교할 때, 인간과의 대화에서 수준 높은 매력을 느끼게 해주는 특징이 있다. 자연스러운 대화를 위해 필요한 맥락과 비유적 언어를 사용하는 능력은 향후 인공지능과의 상호작용을 더욱 매끄럽게 만들 것으로 기대된다.
한 연구원은 “현재 인공지능이 감정과 논리적인 판단을 통해 대화에 적극적으로 참여하고 있다”며, “이제 AI는 단순한 문답을 넘어, 실제 사람처럼 대화할 수 있는 능력이 필요해졌다”고 말했다.
텍스트 분석에 따르면 GPT-4.5는 시험에 사용된 AI 모델 중 가장 높은 73%의 정확도로 인간과 대화할 때 '사람 같다'는 점수를 기록했다. 이는 50%의 전통적인 AI와 비교했을 때 높은 수치이다.
결론적으로 연구팀은 “GPT-4.5와 같은 인공지능 모델이 매우 진행된 대화 능력을 보여주며, 실제 대화에서의 적용 가능성에 대한 논의가 필요하다”고 강조했다. 이러한 발전은 앞으로 인간과 AI 간의 상호작용을 더욱 향상시킬 것으로 기대된다.