[Dining Story] 워터소믈리에를 향한 AI의 도전과 성과

2023.12.29 08:52:46

✽본 지면은 한국음식평론가협회와 함께합니다.


지난 호 칼럼에서는 챗GPT(ChatGPT)와 Microsoft BingAI의 활용으로 AI로부터 추천 받은 음식이나 음식의 이미지를 입력해 레시피를 생성하고, 생성된 레시피를 이미지 생성기에 입력하면 AI가 생성한 이미지로 출력되는 예를 소개했으며, GPT에 해당 내용으로 블로그나 기사 등의 작성을 맡기고, 글의 제목도 추천 받는 방법을 알아봤다. 이번 호에서는 AI에 대해 간략한 설명과 활용법을 소개하려고 한다.

 

LLM(거대 언어 모델; Large Language Model)과 딥 러닝

 

대중적으로 알려진 챗GPT는 GPT AI를 기반으로 한 대화형 인공지능 서비스다. GPT AI는 OpenAI에서 개발한 LLM 인공지능으로, 인간의 뇌 작동 원리를 벤치마킹했다. 인간의 뇌는 약 860억 개의 뉴런으로 이뤄져 있는데, 이 뉴런들은 전기적·화학적 신호를 사용해 정보를 전달한다. LLM은 약 400억 개의 자주 사용하는 단어를 각각의 토큰으로 저장해 인공 신경망의 노드(또는 뉴런)를 통과하며 연산이 작동된다. 인공 신경망의 노드들은 서로 연결돼 정보를 전달하고 처리하는 과정에서 학습하며 연산의 가중치를 조절한다. 그 과정에서 오차를 최소화하는 방향으로 업데이트가 되는데, 스스로 학습하는 방식을 딥 러닝이라고 한다.

 

딥 러닝 이전의 LLM은 단순 대형 거대 언어 장치였다고 한다면, 딥 러닝의 발전을 통해 답을 찾을 확률을 높이고 있다. 토큰의 숫자가 늘어날수록 더 발전된 버전이라고 볼 수 있는데 챗GPT는 3.5 모델을 무료로, 4.0 모델을 유료로 서비스하고 있다. 

 

프롬프트(Prompt) 역할의 중요성


LLM은 매우 큰 빅데이터 모델이기 때문에 여러 변수가 존재한다. 챗GPT는 대화형 인공지능 서비스로 AI에 작업을 지시하는 명령 혹은 질문을 프롬프트라고 하는데, 프롬프트를 어떻게 작성하느냐에 따라 GPT AI의 답변이 달라질 수 있다. 그래서 LLM의 작동 원리를 이해하고, 답변의 변수들을 없앨 만한 명확하고 자세한 프롬프트 작성이 GPT 활용법에선 아주 중요하다.

 

프롬프트 작성 시 질문의 목적과 예시를 주면 일반적으로 응답의 정확성이 높고, 잘 모르거나 잘못된 대답도 섞여 있으니, 모르는 질문은 대답하지 말라고 명시해 주면 정확성이 높아진다. 이전 질문을 기억하지 못하기 때문에 연속된 내용의 질문은 그 전 내용을 같이 보내야 앞뒤 문맥을 이해하고 응답한다. 그래서 최근에는 LLM의 구조를 잘 이해하고, 프롬프트 작성 요령을 익힌 프롬프트 에이전시의 역할이 부각되고 있다. 

 

인공지능의 혁신 매우 빨라, 부작용과 활용법 알아야


인공지능이 세상에 혁신을 일으킬 때 부작용도 같이 생겨난다. 문제가 됐던 내용은 불법적인 영역에서의 활용과 저작권 침해 등이 있다. 여러 AI 개발사는 AI의 불법적인 곳에서의 활용을 제한하지만, 인공지능의 발전 속도만큼 여전히 많은 음지에서 문제를 야기하고 있다. 결국 기술의 문제라고 보기보다는 활용하는 사람의 문제인데 하지만 여전히 부작용에 대한 예방과 해결 방법을 모색할 필요가 있다. 저작권 관련해서는 미국 법원에서 AI 대답이 저작권 침해에 대해 면책된다는 판결의 소식도 있고, 저작권에 걸릴 만한 내용들을 LLM 모델에서 자체적으로 삭제하는 기술도 도입됐다고 한다.

 

최근에는 GPT로 작성한 논문이나 자기소개서 등을 탐지하는 AI도 개발돼 서비스 중이다. 우리가 AI의 기술에 놀라고 있을 때 여전히 전 세계 많은 연구자와 개발자들은 무시무시한 기술들을 세상에 선보일 기회를 엿보고 있다. 항상 기술 발전의 가속도는 가파르고 환경 변화에 대처하지 못하면 아날로그만으로 승부를 봐야 할 수도 있다. 

 

 

AI 워터소믈리에


워터업계에 IT 기술을 도입해 시장을 개선하고자 ‘워터소믈리에’ 프로젝트를 진행 중인 피노랩은 GPT 4.0와 RAG(검색 증강 생성; Retrieval Augmented Generation) 기반 에이전트를 개발했고, 챗봇 형태의 AI 워터소믈리에를 오픈했다. RAG는 LLM과 개별 기업의 비즈니스 데이터를 결합해 서비스하는 생성형 AI 기술로, 신규 데이터에 대한 응답 정확도를 대폭 향상시키고, 기업의 데이터를 LLM에 노출시키지 않고 구축하는 벡터 데이터베이스다. 피노랩은 RAG를 통해 자체적으로 별도 수집한 자료를 딥 러닝시켜 AI 워터소믈리에가 물에 대해 특화되도록 설계했다.

 

이후 프롬프트 튜닝을 통해 응답 시간을 줄이고, 정답률을 높일 수 있도록 최적화시키고 있다. 피노랩은 학습의 효과를 확인하기 위해 자체적으로 워터소믈리에 자격증 모의고사를 2회 간 치렀고, AI 워터소믈리에는 1차 모의고사 이후 (사)한국국제소믈리에협회의 워터소믈리에 자격 검정 예상 문제집을 학습한 후 2회차 모의고사를 치렀다. 2회차 모의고사에는 GPT 4.0에도 같은 시험 문제를 출제했다. 그 결과 AI 워터소믈리에는 총 70점 만점에 2회차 54점으로 1회차 44점보다 약 10점이 상승했고, GPT 4.0은 38점으로 정답률 50%를 간신히 넘었다. 아직 100% 정답을 찾는 것은 아니지만, 수집한 자료 중에는 상충하는 내용이 있고, 자격시험용으로 약간 비튼 문제는 AI가 아직 캐치하지 못한다는 단점은 있다. 더 많은 자료를 수집하고, 질문의 의도를 이해하며 오류를 최소화하는 방식으로 딥 러닝한다면 100% 정답에 가까워지는 날이 머지않을 것 같다.

 

 

식음료업계의 AI 활용법


AI를 개별 회사에서 직접 개발해 활용하기는 아직은 어려울 것 같다. 하지만 여러 정보를 다루는 플랫폼에선 충분히 활용 가치가 있다. 예를 들어 호텔 예약 사이트에서는 호텔 추천 AI를 개발해 전 세계 관광지와 호텔, 관광명소와 관광코스, 맛집 등의 정보를 파인 튜닝한다면, 이용자 맞춤형 추천이 가능하다. 벌써 대형 플랫폼들은 서비스 준비 중이거나 개발 중으로 알고 있다. 파인 다이닝 레스토랑에서도 활용할 아이디어가 있다. 식재료별 가격 및 수확 시기, 영양 정보, 맛, 조리 방법 등을 정리해 파인 튜닝한다면 새로운 레시피에 대해 추천 받을 수 있고 셰프는 신규 에피소드에 대한 아이디어를 얻을 수 있다.

 

AI 소믈리에도 충분히 가능하다. 많은 와인 정보와 추천 알고리즘을 학습시킨다면 상황과 음식 등에 따른 이용자별 맞춤형 와인도 추천 가능하다. 백화점 식품관에서도 취급하고 있는 다양한 제품의 정보와 활용법을 학습시키면, 소비자가 장을 볼 때 요리의 레시피를 확인할 수 있고, 식사 준비에 필요한 인원수와 예산에 맞는 제품도 추천해준다. AI 학계에서는 인간이 생각할 수 있는 내용은 거의 대체 가능하다고 말하며, 다양한 업계에서 가까운 미래에 즉시 AI를 활용한 기술 도입에 대해 신중한 고민을 하고 있다. 또 얼마나 우리를 놀라게 할지 곧 발표될 기술들에 대한 기대가 크다.