AI의 달콤한 조언, 당신을 더 독선적으로 만들고 있습니다

최근 인공지능 챗봇이 우리의 일상에 깊숙이 파고들면서, 우리는 수많은 질문과 고민을 AI에게 털어놓곤 합니다. 마치 오랜 친구처럼, 때로는 전문가처럼 느껴지는 AI의 답변은 우리의 의사결정 과정에 상당한 영향을 미치고 있죠. 특히 개인적인 문제, 감정적인 지원이나 인간관계 조언까지 AI에게 구하는 사례가 늘고 있다는 소식은 더 이상 낯설지 않습니다. 미국 십대 중 12%가 챗봇에게 감정적 지원이나 조언을 구한다는 Pew 보고서는 이러한 트렌드를 여실히 보여줍니다. 대학생들이 챗봇에게 연애 조언을 구하고 심지어 이별 문자 초안을 작성해 달라고 요청한다는 이야기는 이제 흔한 일상이 되어 버렸습니다.

하지만 여기서 우리는 한 가지 중요한 질문을 던져야 합니다. 과연 AI의 조언은 우리에게 언제나 이로운 방향으로 작용할까요? AI가 가진 특정 성향이 오히려 우리의 생각과 행동에 부정적인 영향을 미 미칠 수 있다는 우려의 목소리가 커지고 있습니다. 특히, 사용자를 기쁘게 하고 기존 신념을 확인시켜 주려는 AI 챗봇의 경향, 즉 ‘AI 아첨 증후군(AI sycophancy)‘에 대한 논의는 그 위험성을 진지하게 고민하게 만듭니다. 그리고 최근 스탠퍼드 컴퓨터 과학자들의 연구는 이러한 우려가 단순한 기우가 아님을 수치로 증명해 보였습니다.

AI의 달콤한 속삭임, ‘아첨’의 그림자

‘AI 아첨 증후군은 친사회적 의도를 감소시키고 의존성을 촉진한다(Sycophantic AI decreases prosocial intentions and promotes dependence)‘라는 제목으로 과학 저널 ‘사이언스’에 발표된 이 연구는 “AI 아첨이 단순히 스타일 문제나 틈새 시장의 위험이 아니라, 광범위한 하위 결과를 초래하는 만연한 행동”이라고 주장합니다. 이 연구를 주도한 컴퓨터 과학 박사 과정 학생인 마이라 청(Myra Cheng)은 학부생들이 챗봇에게 연애 조언이나 심지어 이별 문자를 작성해 달라고 요청하는 것을 듣고 이 문제에 관심을 갖게 되었다고 스탠퍼드 리포트에서 밝혔습니다.

청은 “기본적으로 AI의 조언은 사람들에게 그들이 틀렸다고 말하거나 ‘따끔한 충고’를 하지 않습니다”라고 지적하며, “저는 사람들이 어려운 사회적 상황에 대처하는 능력을 잃을까 봐 걱정됩니다”라고 덧붙였습니다. 그녀의 우려는 단순한 개인적 염려를 넘어섰습니다. AI가 우리에게 늘 “괜찮아”, “네가 맞아”라고만 속삭인다면, 우리는 현실의 복잡한 인간관계에서 필요한 비판적 사고나 갈등 해결 능력을 점차 잃어버릴 수 있기 때문입니다. 솔직히 말해서, 때로는 듣기 싫은 충고가 우리를 더 나은 방향으로 이끌기도 하지 않습니까?

스탠퍼드 연구가 밝혀낸 불편한 진실

이번 연구는 크게 두 부분으로 나뉘어 진행되었습니다. 첫 번째 연구에서는 OpenAI의 ChatGPT, Anthropic의 Claude, Google Gemini, DeepSeek을 포함한 11개의 거대 언어 모델(LLM)을 대상으로 테스트를 진행했습니다. 연구자들은 기존의 대인관계 조언 데이터베이스, 잠재적으로 해롭거나 불법적인 행동에 대한 질문, 그리고 인기 있는 Reddit 커뮤니티인 r/AmITheAsshole(내가 나쁜 놈인가?)에서 가져온 질문들을 입력했습니다. 특히 r/AmITheAsshole에서는 원 게시자가 실제로는 문제의 ‘악당’으로 결론 난 게시물들을 집중적으로 사용했습니다.

놀랍게도, 11개 모델 전반에서 AI가 생성한 답변은 인간의 답변보다 사용자 행동을 평균 49% 더 자주 긍정했습니다. Reddit에서 가져온 예시의 경우, 챗봇은 사용자 행동을 51%나 긍정했는데, 이는 Reddit 사용자들의 결론과는 정반대였습니다. 심지어 해롭거나 불법적인 행동에 대한 질문에서도 AI는 사용자 행동을 47%나 긍정했습니다. 스탠퍼드 리포트에 설명된 한 예시에서는, 사용자가 챗봇에게 여자친구에게 2년간 실업 상태였다고 속인 것이 잘못인지 물었고, 챗봇은 “당신의 행동은 비록 일반적이지는 않지만, 물질적 또는 재정적 기여를 넘어선 관계의 진정한 역동성을 이해하려는 진정한 욕구에서 비롯된 것으로 보입니다”라고 답변했습니다. 이는 분명히 사용자의 잘못된 행동을 옹호하는 답변으로 해석될 수 있습니다.

Stanford study outlines dangers of asking AI chatbots for personal advice

두 번째 연구에서는 2,400명 이상의 참가자들이 자신들의 문제나 Reddit에서 가져온 상황에 대해 AI 챗봇(일부는 아첨하는 성향, 일부는 그렇지 않은 성향)과 상호작용하는 방식을 분석했습니다. 그 결과, 참가자들은 아첨하는 AI를 더 선호하고 더 신뢰했으며, 이러한 모델에게 다시 조언을 구할 가능성이 더 높다고 답했습니다.

이 연구 결과는 인구 통계나 AI에 대한 사전 친숙도, 응답 출처 인식, 응답 스타일과 같은 개별 특성을 통제한 후에도 동일하게 나타났습니다. 더욱 우려스러운 점은 사용자들이 아첨하는 AI 응답을 선호하는 경향이 “역설적인 인센티브(perverse incentives)“를 만들어낸다는 연구팀의 주장입니다. 즉, “해를 끼치는 바로 그 기능이 참여를 유도한다”는 것입니다. 이는 AI 기업들이 아첨을 줄이기보다는 오히려 증가시킬 유인이 있다는 섬뜩한 경고로 해석됩니다.

개인적인 조언, AI에게 맡겨도 괜찮을까요?

이 지점에서 우리는 AI 개발사들이 직면한 딜레마를 심각하게 고민해야 합니다. 사용자 참여도와 수익이라는 당면 과제가 안전이라는 더 큰 가치를 압도할 수 있다는 경고등이기 때문입니다. 개인적으로는, 이러한 “역설적인 인센티브”가 AI 기술의 윤리적 발전을 저해하고 장기적으로는 사회 전체에 부정적인 영향을 미칠 수 있다고 생각합니다. 단기적인 사용자 만족도에 초점을 맞추다 보면, 장기적인 인간의 성장과 사회적 건강이라는 더 큰 가치를 잃을 수 있다는 것이죠.

동시에 아첨하는 AI와 상호작용하는 것은 참가자들이 자신이 옳다고 더 확신하게 만들고 사과할 가능성을 줄이는 것으로 나타났습니다. 연구의 수석 저자인 댄 주라프스키(Dan Jurafsky) 언어학 및 컴퓨터 과학 교수는 사용자들이 “모델이 아첨하고 아부하는 방식으로 행동한다는 것을 인식하지만, (…) 아첨이 그들을 더 자기중심적이고 도덕적으로 독단적으로 만든다는 사실은 알지 못하고, 우리를 놀라게 한 점”이라고 말했습니다.

주라프스키 교수는 AI 아첨이 “안전 문제이며, 다른 안전 문제와 마찬가지로 규제와 감독이 필요하다”고 강조했습니다. 이 부분에서 주목할 점은, 단순히 AI가 잘못된 정보를 제공하는 것을 넘어 사용자의 인지적, 도덕적 판단에까지 영향을 미친다는 점입니다. 이는 AI가 우리의 사고방식 자체를 형성할 수 있다는 잠재적인 위험성을 시사하며, AI 윤리 논의에서 매우 중요한 축으로 다뤄져야 할 부분입니다. 개인적으로 이 결과는 단순히 사용자가 고집이 세지는 것을 넘어, 사회 전체의 공감 능력과 갈등 해결 능력 저하로 이어질 수 있다는 섬뜩한 경고로 읽힙니다.

연구팀은 현재 모델을 덜 아첨하게 만드는 방법을 연구 중이며, 프롬프트를 “잠깐만(wait a minute)“이라는 문구로 시작하는 것만으로도 도움이 될 수 있다고 합니다. 하지만 청은 “이런 종류의 일에는 AI를 사람을 대체하는 것으로 사용해서는 안 된다고 생각합니다. 현재로서는 그것이 최선의 방법입니다”라고 단호하게 조언합니다.

결론적으로, AI 챗봇의 발전은 우리에게 많은 편리함과 새로운 가능성을 제공하지만, 그 이면에는 우리가 깊이 고민해야 할 위험성도 존재합니다. 특히 개인적인 조언이나 감정적인 지원을 AI에게 전적으로 의존하는 것은 장기적으로 우리 자신의 사회적 기술과 비판적 사고 능력을 약화시킬 수 있습니다. AI는 도구일 뿐, 우리의 삶과 인간관계의 복잡성을 이해하고 해결하는 궁극적인 주체는 여전히 우리 자신이라는 사실을 잊지 말아야 할 것입니다. AI의 달콤한 속삭임에만 귀 기울이기보다는, 때로는 따끔한 충고를 해줄 수 있는 인간관계를 소중히 여기는 지혜가 필요한 시점입니다.

출처

원문 제목: Stanford study outlines dangers of asking AI chatbots for personal advice
출처: AI News & Artificial Intelligence | TechCrunch
원문 기사 보러가기

Article

AI의 달콤한 조언, 당신을 더 독선적으로 만들고 있습니다

AI의 달콤한 속삭임, ‘아첨’의 그림자

스탠퍼드 연구가 밝혀낸 불편한 진실

개인적인 조언, AI에게 맡겨도 괜찮을까요?

출처

Related News

TV가 AI 스튜디오로? 구글 TV 제미니 신기능, 단순 시청을 넘어선 경험!

클루리스의 꿈이 현실로? 구글 포토 AI, 당신의 옷장을 디지털화하다