학습 차원에서 틈틈이 해외 전문가들이 블로그나 미디어 그리고 책에서 쓴 글을 번역 또는 요약 정리하고 있습니다. 이번 포스팅도 그중 하나고요. 거칠고 오역된 부분이 있을 수 있습니다. 제대로 번역되지 않은 부분은 확인 주시면 반영토록 하겠습니다. 의미 전달이 애매한 문장은 삭제했습니다. 이번에는 Austin Starks가 미디엄에 쓴 글을 정리한 것입니다.
나는 링크드인을 검색할 때도 곧 출시될 슬롯사이트사이트들에 대해 제품 관리자들이 쏟아내는 과장을 보지 않고는 검색을 할 수 없다.다음으로 넘어가기 전 말해두지만 나는 편파적이지 않다. 나는 ChatGPT가 나오기 전부터 거대 언어 모델(LLM)으로 일을 해왔다. 당시에는 오픈AI 웹사이트에 GPT-3가 있었고 GPT-3는 문장 다음 단어만 예측했다.(지금 익숙한 채팅 인터페이스와는 대조적이다).실전 투입 준비가 된 슬롯사이트사이트를 출시한 소프트웨어 엔지니어들은 얼마나 알고 있는가? 맞다. 없다. 이유는 다읍과 같다.
AI 슬롯사이트사이트란?
슬롯사이트사이트 사실 인공지능 분야에서 오래됐다. ChatGPT가 나온 이후 최근에는 추론을 수행하고 자율적으로 작업을 완료하도록 구성된 LLM을 의미하게 되었다.이 모델은 강화 학습을 통해 미세 조정된 것일 수 있지만 실제 사람들은 OpenAI GPT, Google Gemini 또는 Anthropic Claude를 사용하는 편이다.
슬롯사이트사이트와 언어 모델 차이점은 슬롯사이트사이트가 작업을 자율적으로 완료한다는 것이다.현재 AI 슬롯사이트사이트가 실제 상황에서 작동하는 이유는 여러가지다.
1.작은 모델은 강력하지 않다.
슬롯사이트사이트를 둘러싼 핵심 문제는 LLM들에 의존한다는 것이다. 좀 더 구체적으로 말하자면, 슬롯사이트사이트들은 좋은 모델에 의존한다.플래시 이외 가장 저렴한 LLM인 GPT-4o mini는 가격 대비 성능이 뛰어나다. 그러나 실제 슬롯사이트사이트 작업을 완료할 만큼 강력한 건 아니다. 아무리 좋은 프롬프트를 제공하더라도 방향을 잃거나 목표를 잊어버리거나 단순한 실수를 할 것이다.
그리고 이것이 실제로 사용된다면, 사용자는 그 대가를 치러야 할 것이다. LLM이 실수를 하면, 검증 프레임워크(아마도 LLM 기반)를 구축하지 않는 한 이를 감지하기가 쉽지 않다. 처음에 작은 실수가 하나라도 생기면, 그 이후 모든 작업이 엉망이 된다.
2. 오류들의 복합화
슬롯사이트사이트 작업에 GPT-4o-mini를 사용하고 있다고 가정해 보자.슬롯사이트사이트가 어떤 회사 재무 정보를 추출하는 작업을 더 작은 하위 작업으로 나눈다. 각 하위 작업들을 올바르게 수행할 확률이 90%라고 가정해 보자.이것으로 인해 오류가 보다 악화된다. 작업이 네 가지 하위 작업을 포함한 다소 어려운 작업일 경우, 최종 결과물이 좋을 확률은 매우 낮다.
예를 들어, 다음과 같이 세분화할 수 있다..
하위 작업 하나를 완료할 확률은 90%다.
하위 작업 두 개를 완료할 확률은 0.9*0.9 = 81%다.
하위 작업 네 개를 완료할 확률은 66%다.
이를 완화하려면 더 나은 언어 모델을 사용해야 한다. 더 강력한 모델은 각 하위 작업 정확도를 99%까지 높일 수 있다. 네 개 하위 작업을 수행한 후 최종 정확도는 96%이다. 훨씬 향상되었지만(완벽하지는 않음).
가장 중요한 것은, 이렇게 강력한 모델로 변경하는 데 많은 슬롯사이트사이트이 든다는 것이다..
더 강력한 OpenAI 모델로 전환하면 슬롯사이트사이트이 얼마나 폭발적으로 증가하는지 확인할 수 있다. GPT-4o-mini 최종 슬롯사이트사이트은 O1 대비 일부에 불과하다. 내가 이걸 OpenAI의 음모라고 생각하는 이유를 알겠는가?마지막으로 코드를 사용하는 작업에서 모델을 사용하는 작업으로 바꾸는 것은 엄청난 부작용을 수반한다.
4. 비결정적 결과(non-deterministic)를 만들고 있다
LLM 슬롯사이트사이트를 사용하면 작업 전체 패러다임이 데이터 과학에 가까운 접근 방식으로 전환된다.어디에서나 실행하기 쉽고, 아두이노(또는 실제로는 AWS의 T2 마이크로 인스턴스)에서 실행할 수 있는 결정적 코드를 작성하는 대신, GPU 클러스터에서 실행되는 모델에 대한 비결정적 프롬프트를 작성한다.
운이 좋다면, 미세 조정된 모델을 자체 GPU에사 운영하게 되겠지만, 간단한 작업을 수행하는 슬롯사이트사이트를 유지하는 데만도 여전히 엄청난 비용이 들 것이다.그리고 운이 나쁘다면, OpenAI에 완전히 종속된다. 바꾸려고 하면 프롬프트가 완전히 작동하지 않을 것이고, OpenAI API로 중요한 비즈니스 프로세스를 실행할 때, 가격이 서서히 올라갈 수 있다.그리고 “OpenRouter를 사용하면 모델을 쉽게 바꿀 수 있다”고 하기 전에 다시 한 번 생각해보라.Anthropic 모델 출력은 OpenAI 출력과는 다르다.따라서 또 다른 LLM 최종 성능을 살짝 개선하기 위해 전체 스택을 다시 엔지니어링해야 하고, 그 슬롯사이트사이트은 엄청날 것이다.문제가 무엇인지 알겠는가?
결론
슬롯사이트사이트에 대한 글을 볼 때면, 언어 모델을 실제로 사용해 본 적이 없는 사람이 쓴 글이라는 것을 거의 확실하게 알 수 있다.상상할 수 있듯, 이것은 정말 화가 나는 일이다.
AI가 사용 사례가 없다고 말하는 것은 아니다. 몇 년 후에는 간단한 코드를 작성하는 엔지니어를 지원하는 데 있어 슬롯사이트사이트가 가치를 발휘할 수도 있다.그러나 합리적인 기업이라면 비즈니스 핵심적인 과정을 운영하기 위해 운영팀을 매우 비싸고 오류가 발생하기 쉬운 슬롯사이트사이트들로 대체하지는 않을 것이다.
만약 그렇게 한다면, 2년 안에 파산하는 모습을 우리 모두 눈으로 직접 보게 될 것이다. 그 과정은 비즈니스 교과서에서 교훈으로 남게 될 것이고, OpenAI는 추가로 10억 달러의 수익을 올리게 될 것이다.