8화: GPT vs Gemini, 누구에게 무엇을 맡길까

앱의 핵심 기능에는 AI가 필요했습니다.

성분을 분석하고, 위험도를 설명하고, 대체 상품을 추천하고, 사진에서 성분표를 읽어내는 것.

그런데 어떤 AI를 쓸 것인가? GPT-4인가, Gemini인가.

JT와 DY가 이 질문을 파고들었습니다.

처음에는 당연히 하나를 골라야 한다고 생각했습니다. “어떤 모델이 더 좋은가”를 비교하면 답이 나올 줄 알았어요.

그래서 같은 질문을 양쪽에 던져봤습니다.

“아스파탐이 들어 있는 제품입니다. 이 성분에 대해 소비자에게 설명해주세요.”

GPT-4의 답변은 이랬습니다. 맥락이 풍부했습니다. 역사적 배경, 규제 기관별 입장 차이, “~라는 연구 결과가 있지만, ~에서는 안전하다고 판단”과 같은 균형 잡힌 설명.

Gemini의 답변은 이랬습니다. 빠르고 간결했습니다. 핵심 정보를 불릿 포인트로 정리하고, “주의할 점”과 “안심해도 되는 이유”를 나눠서 보여줬어요.

어떤 게 더 좋다고 말하기 어려웠습니다. 용도가 다른 거였어요.

그래서 전략을 바꿨습니다.

“하나를 선택하는 게 아니라, 기능별로 모델을 나누자.”

JT가 제안한 역할 분배표는 이랬습니다:

GPT가 맡을 영역:

Gemini가 맡을 영역:

이유는 명확했습니다.

GPT-4는 글을 잘 씁니다. 사람이 읽었을 때 “이해된다”는 느낌을 주는 문장을 만들어요. 하지만 느립니다. 그리고 비쌉니다.

Gemini는 빠르고, 멀티모달에 강합니다. 사진을 주면 바로 텍스트로 변환해주고, 응답 속도가 체감될 정도로 빠릅니다.

앱에서 바코드를 찍고 1~2초 안에 결과를 보여줘야 하는 상황에서는 Gemini가 맞고, “이 성분이 왜 논란이 되는지”를 차분하게 설명해야 하는 상황에서는 GPT가 맞았습니다.

미아가 여기서 중요한 원칙을 하나 세웠습니다.

“AI가 생성하는 모든 텍스트에는 출처를 붙여야 해요. ‘~에 따르면’이 없는 문장은 우리 앱에 실으면 안 됩니다.”

이것은 어떤 모델을 쓰든 적용되는 규칙이었습니다. AI는 도구이고, 도구가 만든 결과물의 신뢰는 우리가 보장해야 하니까요.

이 역할 분배 전략은 첵잇의 AI 아키텍처 기반이 되었습니다.

AI를 ‘하나의 만능 도구’로 보는 대신, 역할이 다른 여러 모듈로 나누어 쓰는 접근.

성분 위험도 탐지기, 성분 설명기, 필터기, 대체 제안기, 이미지 파서. 각각의 모듈에 가장 적합한 모델을 배치하는 구조예요.

사실 지금 돌이켜보면, 이 구상대로 완벽하게 구현되지는 않았습니다. 현재 프로젝트에서는 Gemini 위주로 통합되어 있어요. 비용과 개발 편의를 고려한 현실적 선택이었습니다.

하지만 “모델별 역할 분배”라는 설계 원칙은 여전히 유효합니다. 서비스가 커지면, 이 구조를 다시 꺼내 쓸 날이 올 거라고 생각합니다.

다음 편에서는 에리와 모모의 이야기를 합니다. 차가운 데이터를 따뜻하게 만드는 두 사람의 역할 — “정보의 온도”에 대해서.