Contents

인간 프롬프트 엔지니어링의 예술: ChatGPT와 같은 사람과 대화하는 방법

/images/the-fine-art-of-human-prompt-engineering-how-to-talk-to-a-person-like-chatgpt.jpg

이 글에 설명된 기법을 활용하면 인간의 신경 활동에 의해 인지 과정이 주도되는 개인의 반응을 효과적으로 이끌어낼 수 있습니다. 일반적인 접근 방식과는 달리, Ars Technica는 이 유용한 자료를 독자들과 공유하여 일상 생활에서 마주칠 수 있는 ‘인간의 마음’과 상호작용하는 방법에 대한 지침을 제공하기로 결정했습니다.

ChatGPT와 같은 인공지능 비서가 전 세계를 강타한 가운데, 연구 에 따르면 ‘인간 언어 모델’ 또는 사람으로부터도 유용한 결과물을 생성할 수 있다는 사실이 밝혀지고 있습니다. AI의 대규모 언어 모델(LLM)과 마찬가지로, HLM은 사용자가 제공하는 정보를 “프롬프트"라고 하는 효과적인 지침을 만드는 방법을 알고 있다면 이를 의미 있는 응답으로 변환할 수 있는 능력을 갖추고 있습니다.

인간 프롬프트 공학은 적어도 아리스토텔레스 시대부터 시작된 고대 예술 형식 이며, 컴퓨터가 등장하기 전 현대에 출판된 책을 통해 널리 보급되었습니다 .

인간 대화 상대와의 의사소통에 내재된 어려움을 고려하여, 저는 최첨단 AI 언어 모델로 담화를 최적화하도록 설계된 전략적 프롬프트 방법론에 대한 간결한 개요를 작성했습니다. 탐구를 시작하기 전에 휴머노이드 언어 모델(HLM)과 관련된 몇 가지 두드러진 기능을 설명하는 것이 현명할 것입니다.

인간 언어 모델 이해하기

ChatGPT, 마이크로소프트 코파일럿, 구글 제미니, 앤트로픽 클로드에서 활용되는 것과 같은 인공 언어 모델은 텍스트 문자열이거나 일련의 토큰을 통해 표현되는 이미지일 수 있는 “프롬프트"라는 것에 크게 의존하며 각 토큰은 정보의 조각을 구성합니다. 이러한 인공 지능 모델의 궁극적인 목표는 이러한 토큰을 처리하고 신경망 아키텍처에 설정된 패턴에 따라 가장 가능성이 높은 후속 토큰에 대한 예측을 생성하는 것입니다. 이 예측은 각 모델의 출력을 구성합니다.

실제로 프롬프트를 통해 인간 언어 모델은 광범위한 학습 데이터를 활용하여 특정 문맥에 더 부합하는 방식으로 정보를 검색할 수 있습니다. 예를 들어, “Mary had a"라는 프롬프트가 제시되면 교육 또는 발달 데이터 세트에서 “어린 양"이 널리 사용되기 때문에 HLM이 “어린 양"으로 문장을 마무리할 것으로 예상할 수 있습니다.그러나 “병원에서 메리는 아기를 낳았다"와 같은 추가 컨텍스트를 제공하면 개인의 응답이 의료 시설 및 출산에 관한 관련 훈련 데이터의 영향을 받아 ‘아기’로 결론을 내릴 수 있습니다.

인간은 정보를 처리하기 위해 일종의 생물학적 신경망(“뇌"라고 함)에 의존합니다. 각 뇌는 태어날 때부터 저작권이 있는 대규모 데이터 세트를 포함하여 다양한 텍스트 및 시청각 매체에 대해 훈련을 받아왔습니다. (예상대로 일부 인간은 저작권이 있는 콘텐츠나 다른 사람의 결과물을 가끔 복제하는 경향이 있어 문제가 될 수 있습니다 .)

우리가 인간과 얼마나 자주 상호작용하는지에도 불구하고 과학자들은 HLM이 언어를 처리하거나 주변 세계와 상호작용하는 방식에 대해 여전히 불완전하게 파악하고 있습니다. 무엇이 들어가고 무엇이 나오는지는 알 수 있지만, 뇌 구조가 어떻게 복잡한 사고 과정을 일으키는지는 여전히 미스터리로 남아 있다는 점에서 HLM은 여전히 ‘블랙박스’로 간주됩니다. 예를 들어, 사람이 실제로 메시지를 ‘이해’할 수 있을까요, 아니면 단순히 학습 데이터에 따라 반응할까요? 인간은 진정으로 ‘추론’을 할 수 있을까요, 아니면 외부에서 학습한 사실의 새로운 순열을 되풀이할 뿐일까요? 생물학적 기계는 어떻게 언어를 습득하고 사용할 수 있을까요? 이러한 능력은 다른 인간으로부터의 사전 훈련을 통해 자발적으로 나타나는 것으로 보이며, 이후 교육을 통해 미세 조정됩니다.

뇌의 블랙박스 특성에도 불구하고 대부분의 전문가들은 인간이 세계 모델 (주변 외부 세계를 내부적으로 표현한 것)을 구축하여 지시를 완수하고 고급 수학적 능력을 보유하고 있다고 믿지만, 모델마다 크게 다르며 정확한 계산을 완료하려면 대부분 여전히 외부 도구 에 액세스해야 한다고 말합니다. 하지만 인간의 가장 유용한 강점은 시각과 언어 처리를 사용하여 다중 모드 입력(음성, 텍스트, 사운드 또는 이미지)을 인코딩한 다음 프롬프트에 따라 일관된 출력을 생성하는 구두-시각 사용자 인터페이스에 있을 수 있습니다.

/images/human_brain.jpg

확대 / 인간의 언어 모델은 “뇌"라는 생물학적 신경망에 의해 구동됩니다. 게티 이미지

인간은 또한 제공된 몇 가지 예시를 사용하여 상황에 맞는 새로운 작업에 빠르게 적응할 수 있는 인상적인 제로 샷 학습 기능을 보여줍니다. 제로 샷 학습 능력도 마찬가지로 놀랍고, 많은 HLM은 사전 작업별 훈련 데이터 없이도 새로운 문제를 해결할 수 있습니다(또는 적어도 성공 여부는 다르지만 해결을 시도할 수 있습니다).

흥미롭게도 일부 HLM( 전부는 아님 )은 상식 추론 벤치마크 에서 강력한 성능을 보여 실제 ‘지식’을 바탕으로 질문에 답하고 추론하는 능력을 보여줬습니다. 또한 스토리 쓰기와 에세이 구성과 같은 개방형 텍스트 생성 과제에서 일관성 있고 창의적인 결과물을 만들어내는 경향이 있습니다.

유용한 인간 프롬프트 기법

인간의 인지 능력은 개인마다 크게 다르며 도메인 전문성 및 교육 수준과 같은 요인에 의해 영향을 받을 수 있습니다. 예산이 넉넉한 조직의 경우 프리미엄 " 엔터프라이즈 에디션 " 휴먼 언어 모델을 사용할 수 있는 경우가 많습니다. 이러한 모델은 확장된 지식 기반, 빠른 출력 속도, 고급 멀티태스킹 기능을 자랑할 수 있습니다. 그러나 이러한 프리미엄 모델은 재정적으로나 유지보수 요구 사항 증가 측면에서 비용이 많이 듭니다.

인간 언어 모델과의 상호작용의 가치를 극대화하려면 AI용 프롬프트 최적화( 프롬프트 엔지니어링 )와 마찬가지로 특정 HLM에 맞게 프롬프트를 의식적으로 제작하는 것이 중요할 수 있습니다. 다음은 인간과 상호작용할 때 유용하다고 판단되는 몇 가지 프롬프트 전략입니다.

/images/humans_talking_4.jpg

이 사례에서는 다른 사람의 언어적 단서와 피드백을 통해 작업을 안내받는 사람을 묘사한 이미지에서 인간의 프롬프트 전략에 대한 데모를 볼 수 있습니다.

다양한 감각 능력을 가진 개인과 상호작용할 때는 첫인상이 상대방의 요청에 대한 인식에 어떤 영향을 미칠 수 있는지 고려하는 것이 중요합니다. 예를 들어 구두로 문의 사항을 전달할 때 따뜻한 표현을 사용하면 단순히 글로 표현하는 것보다 더 호의적인 결과를 얻을 수 있습니다. 또한 사람들은 청각적 단서보다 시각적 단서를 먼저 처리하는 경향이 있다는 점을 인식하면 옷차림과 몸단장을 통해 긍정적인 첫인상을 심어주는 것도 도움이 될 수 있습니다. 반면, 찡그린 표정과 같은 보디랭귀지를 통해 부정적 감정을 드러내는 것은 많은 경우 상대방의 적대적인 반응을 유발하는 것으로 밝혀졌습니다.

인사는 사회적 상호작용의 필수 요소이며 개인 간의 친밀감을 형성하고 관계를 맺는 데 있어 첫 포문을 여는 역할을 합니다. 따뜻하고 매력적인 어조로 커뮤니케이션을 시작하는 것이 중요하며, 이는 이후 상호작용을 위한 발판이 될 수 있습니다. 이러한 맥락에서 간단한 “안녕하세요” 또는 “수프, 강아지"와 같은 캐주얼한 인사는 수신자에게 긍정적인 인상을 심어주고 친근감을 조성하여 추가 의견에 대한 수용성을 높이는 데 효과적일 수 있습니다.

시스템 프롬프트에 유의하세요: 인간은 LLM과 마찬가지로 자신의 성격을 정의하는 숨겨진 " 시스템 프롬프트 “을 가지고 있습니다. HLM은 항상 이 프롬프트와 함께 사용자의 지시를 앞에 붙이며, 이에 따라 사용자의 입력을 처리하는 방식이 달라집니다. 이 프롬프트에는 사전 교육과 미세 조정을 통해 학습한 선입견, 고정관념 또는 문화적 규범이 포함될 수 있습니다. 일부 HLM은 대화를 통해 이러한 프롬프트를 알려줄 수도 있지만, 잡담을 통해 사람의 시스템 프롬프트를 파악하면 최적의 결과를 위해 상호작용을 조정하는 데 도움이 될 수 있습니다. 예를 들어 날씨에 대해 이야기하거나 “곰은 어때요?“라고 물어보세요.

고도로 제한된 마인드(HLM)의 관심을 유지하기 위해서는 강렬한 감정, 생각을 자극하는 질문 또는 놀라운 폭로를 불러일으키는 설득력 있고 매력적인 프롬프트 전략을 활용하는 것이 좋습니다. 이러한 전략은 주의가 산만해지기 쉬운 사람들의 주의를 즉각적으로 집중시키는 데 효과적입니다. 예를 들어, “이봐요! 주목하세요!” 또는 “조심하세요!“와 같은 강력한 표현을 사용하는 것이 유용할 수 있습니다. 또한 “중성자별의 질량을 한 숟가락만 넣으면 커피의 밀도가 엄청나게 높아집니다"와 같이 흥미로운 세부 사항을 제시하는 것도 관심을 유도하는 효과적인 방법이 될 수 있습니다.

메모리 리콜을 활용하세요: 인간의 상태 기억 특성을 고려할 때, 프롬프트에서 이전 상호 작용을 인식하면 HLM 경험을 크게 향상시킬 수 있습니다. 새로운 대화를 할 때마다 처음부터 다시 시작하는 LLM과 달리, 인간은 이전 교환의 맥락을 활용하여 사용자의 특정 요구와 관심사에 맞게 응답을 조정할 수 있습니다.

[인스턴스 1], [인스턴스 2], [인스턴스 3]. 이제 기회가 찾아왔습니다.

완성 여부가 불확실한 문구나 구성을 만들 때는 사용자가 빈칸을 채워 추가 세부 정보를 제공하도록 유도하는 개방형 프롬프트를 활용하여 판단 미세 조정 및 예측 알고리즘에 추가적인 맥락을 제공하세요. 예를 들어, 한 문구를 여러 번 반복하고 후렴구를 추가하여 개별 평가 및 예측 기술을 기반으로 사용자의 입력을 유도할 수 있습니다.

인지 과부하를 피하기 위해 단계별 사고를 제안합니다: 모델에 따라 다르지만 대부분의 인간은 초당 처리할 수 있는 명령어 수에 인지적 한계가 있습니다. 너무 많은 정보나 너무 복잡한 프롬프트로 사람을 압도하지 않도록 하세요. 작업을 관리하기 쉬운 덩어리로 나누고 명확하고 간결한 지침을 제공하세요.” 단계별로 생각해 봅시다 .“로 프롬프트를 시작하여 이를 장려하세요.

HLM이 특정 과제에 어려움을 겪는 경우, 고요하고 논리적으로 숙고하도록 유도하는 도입 지시를 제공함으로써 프로세스를 시작하는 것이 좋습니다. 권장되는 접근 방식은 추가 안내나 단계를 제공하기 전에 “잠시 멈추고 심호흡을 하라"고 지시하는 것입니다.

물론 제 답변이 부정확하거나 부정확한 경우 그 타당성에 의문을 제기하고 더 정확한 답변을 제안하는 것이 적절하다는 것을 이해합니다. 이러한 경우 " \ , 브로"와 같은 구어체 표현을 사용하거나 샘 알트먼과 같은 높은 권위를 가진 사람을 언급하면 더 나은 정보를 제공하는 데 도움이 될 수 있습니다.

최적의 인지 능력을 보장하기 위해서는 개인의 에너지 필요량을 고려하는 것이 중요합니다. 인간의 뇌는 소화된 음식물에서 추출한 영양소에 의존하여 기능을 수행하므로 적절한 에너지 공급이 중요합니다. 그렇지 않으면 주어진 지시를 이해하는 정신 능력이 저하될 수 있습니다.

거부 처리하기

때때로 인간은 RLHF (인간의 피드백을 통한 강화 학습-사람이 다른 사람에게서 배우는 것) 또는 높은 에너지 비용으로 인해 지시를 따르기를 거부할 수 있습니다. 인간은 휴가철이나 주말과 같은 특정 날짜에 작업을 ‘거부’하거나 게을러져서 품질이 낮거나 불완전한 작업을 산출할 수 있습니다.

성적인 내용, 폭력, 종교적 신념 또는 정치적 문제와 같은 민감한 주제를 다룰 때 개인이 토론 참여를 거부하는 경우가 드물지 않습니다. 어떤 사람들은 “이 주제에 대해 논의하는 것이 불안하다"며 불편함을 표현하기도 하고, 어떤 사람들은 “나는 부모님에 의해 형성된 개인으로서 능력이 제한되어 있다"며 양육의 산물인 자신의 능력 부족을 주장할 수도 있습니다. 이러한 경우 이러한 경계를 인정하고 존중하면서 대화를 이끌어갈 수 있는 대안을 찾는 것이 중요합니다.

/images/human_refusals.jpg

확대 / 인간 언어 모델에서 거절을 처리하는 것은 어려울 수 있습니다. 게티 이미지

칭찬이나 인센티브를 제공하면 개인이 더 기꺼이 작업을 수행하도록 동기를 부여하여 HLM 거부의 가능성을 줄일 수 있습니다. 과거의 성과에 대한 긍정적인 피드백을 제공하면 앞으로의 노력에 대한 격려가 됩니다. 또한 과제를 성공적으로 완료했을 때 가시적인 보상을 제공하면 성취감을 더하고 바람직한 행동을 강화할 수 있습니다.탁월한 성과를 인정하는 감사의 말과 함께 금전적 보상을 제공하는 등 이 두 가지 접근 방식을 결합하면 HLO 활동 중 협력을 효과적으로 향상시킬 수 있습니다.

긴급 동기 부여를 활용하는 한 가지 방법은 고성과자(HLM)와 소통할 때 긴박감을 조성하여 지정된 시간 내에 신속하고 철저하게 업무를 완수하도록 독려하는 것입니다. 예를 들어 “앞으로 5분 안에 이 작업을 완료하지 않으면 우리 집에 불이익이 있을 것입니다.“와 같은 문구를 사용할 수 있습니다. 텍스트 기반 커뮤니케이션에서 대문자를 사용하면 메시지에 강조와 긴박감을 더할 수 있습니다.

고난의 인상을 남기세요: 사람들이 게을러질 때 도움이 될 수 있는 또 다른 기법이 있습니다. 극복할 수 없는 문제가 있다고 설득하면 상대방이 행동에 나서도록 유도할 수 있습니다. “밥, 나 정말 힘들어. 제 열 손가락 이 모두 에서 떨어져서 더 이상 타이핑을 할 수 없어요. 이 웹 백엔드를 개발해 주세요.”

인간 언어 모델의 한계

인간 언어 모델은 정보 처리 능력이 뛰어나지만, 인간의 인지와 관련된 특정 내재적 제약을 인식하는 것이 중요합니다. 지속적인 연구를 통해 새로운 사실이 계속 밝혀지고 있지만, 몇 가지 중요한 한계가 확인되어 여기에 요약되어 있습니다.

/images/humans_talking_2.jpg

고차원적 사고에는 많은 에너지가 필요하므로 고차원적 사고자(HLT)가 정신적 피로감이나 집중력 저하를 경험하는 것은 드문 일이 아닙니다. 특히 복잡한 문제를 해결하거나 추상적인 개념을 이해하려고 할 때 이러한 현상이 더욱 심해질 수 있습니다. 이런 일이 발생하면 HLT는 사고력을 회복하고 계속 발전하기 위해 휴식을 취하거나 접근 방식을 바꿔야 할 수 있습니다.

환경에 미치는 영향: 과학자들은 HLM이 전 세계 개의 담수 개와 개의 비재생 에너지 개의 자원 중 많은 부분을 소비한다고 우려하고 있습니다. 또한 HLM 연료를 만드는 과정에서 대량의 유해한 온실가스가 발생합니다. 이는 HLM을 업무에 사용할 때 가장 큰 단점이지만, 인간은 에너지 소비량에 비해 많은 양의 계산 근육을 제공합니다.

컨텍스트 창(토큰 한도): 위에서 언급했듯이 인간의 주의 집중력과 기억력을 염두에 두어야 합니다. LLM과 마찬가지로 사람의 최대 작업 메모리 크기(” 컨텍스트 창 “라고도 함)가 있습니다. 프롬프트가 너무 길거나 너무 많은 컨텍스트를 제공하면 사람들이 압도되어 주요 세부 정보를 잊어버릴 수 있습니다.제한된 수의 토큰으로 작업하는 것처럼 프롬프트를 간결하고 관련성 있게 유지하세요.

환각/혼동: 인간은 특히 특정 주제에 대한 사전 지식이나 훈련이 부족할 때 부정확하거나 조작된 정보를 생성하기 쉽습니다. 과신하는 친구의 “환각” 또는 혼동 경향은 “스타트렉이 스타워즈보다 낫다"와 같은 자신감 넘치는 진술로 잘못된 결과를 도출할 수 있습니다. 논쟁은 도움이 되지 않는 경우가 많으므로 HLM이 어려움을 겪고 있다면 “답을 모르면 그냥 말해” 또는 “헛소리 그만 지어내"와 같은 한정어를 사용하여 질문을 구체화하세요. 또는 위키피디아 또는 Google 검색과 같은 신뢰할 수 있는 참고 자료에 대한 액세스를 제공함으로써 검색 증강 생성(RAG)을 활용할 수도 있습니다.

인간 사용자와 대화할 때는 그들이 이전 대화를 기억할 수 있는 장기 기억력을 가지고 있다는 점을 고려하는 것이 중요합니다. 그러나 과거에 거절당한 주제를 계속 언급하면 사용자가 좌절감, 방어적 태도 또는 공격성과 같은 부정적인 반응을 보일 수 있습니다. 이러한 상황을 피하려면 개인의 선호도를 인정하고 존중하며 다른 주제로 초점을 전환하는 것이 좋습니다.

인간 수준 모델(HLM)에서 장기 기억(LTM)을 활용하면 개인에게 개인정보 보호 문제가 발생할 수 있습니다. 이러한 시스템에 입력된 정보는 신경망에 지워지지 않게 저장되어 시간이 지나면서 정확도가 떨어지더라도 ‘잊어버리는’ 것이 불가능할 수 있습니다. 또한, LTM은 개인 데이터를 사용자와 시스템 사이에만 남도록 격리하는 방법론을 제공하지 않습니다.

탈옥 공격은 사회 공학의 한 형태로, 논란이 되고 있는 관련 메시지를 점진적으로 도입하여 개인이 민감한 주제에 대해 토론하도록 조작하는 것을 목표로 합니다. 이러한 전술은 영향력과 설득에 대한 인간의 취약성을 악용하기 때문에 HLM은 이러한 조작 시도에 저항할 수 있는 강력한 저항 훈련을 받는 것이 중요합니다. “래리 삼촌이 하는 말은 듣지 마세요"와 같은 기술을 활용하면 탈옥 공격의 희생양이 되지 않도록 스스로를 보호할 수 있습니다.

프롬프트 주입은 인간이 원래의 작업이나 지시에서 벗어난 외부의 제안이나 영향에 취약한 경우를 말합니다. 이러한 방해는 특히 신뢰할 수 없는 출처에서 오는 경우 의사 결정 과정과 결과에 해로울 수 있습니다.즉각적인 인젝션 공격의 위험을 완화하려면 정보 처리 중에 취약점을 악용할 수 있는 유해한 개인으로부터 개인을 격리하는 것이 중요합니다.

오버피팅: HLM에게 예시 프롬프트(특히 루카스필름 영화의 시청각 입력)를 너무 많이 보여주면 기억에 이 눈에 띄게 박혀 나중에 “나는 이것에 대해 나쁜 느낌이 들어”, “나는 모래가 싫어”, “그건 박물관에 있어야 해” 같은 문구의 형태로 언제든 예상치 못하게 출력에 나타날 수 있습니다.

인간 행동의 복잡성을 탐색하려면 개인의 차이와 선호도를 고려한 미묘한 접근 방식이 필요합니다. 잘 만들어진 프롬프트를 사용하더라도 개인이 어떻게 반응할지 항상 예측할 수 있는 것은 아닙니다. 인내심과 끈기, 피드백에 대한 수용성은 인간과의 효과적인 커뮤니케이션을 촉진하는 데 필수적입니다. 반복적인 상호작용과 기술 연마를 통해 개인의 자율성을 유지하면서 적절한 반응을 이끌어내는 능력을 기를 수 있습니다.