산학협력·칼럼 소식
AI 스타트업, 명분보다 시장에 집중할 때
서울대학교 공과대학 공학연구원 김장길 교수
서론
2025년 6월, 정부는 국가 주도 인공지능 전략의 필요성을 강조하며 '독자 AI 파운데이션 모델' 프로젝트를 공식화했다. 과학기술정보통신부, 정보통신산업진흥원 등 여러 기관이 협력해 기획한 이 사업은 초기 2,000억 원의 예산을 투입하고, 장기적으로는 100조 원 규모까지 확대하겠다는 청사진이 제시되었다. 목표는 2026년 말까지 글로벌 빅테크와 격차를 줄이고, 한국어와 한국 산업 맥락에 특화된 고성능 파운데이션 모델을 확보하는 것이다.
이 프로젝트의 수행 주체로 네이버클라우드, 업스테이지, SK텔레콤, NC AI, LG AI연구원 등 다섯 컨소시엄이 선정되었다. 각 컨소시엄은 저마다 다른 전략과 강점을 내세우며 경쟁과 협력을 동시에 이어가고 있다. 네이버클라우드는 풀스택 기술력을 앞세워 텍스트, 이미지, 오디오, 비디오를 통합하는 옴니 모델을 준비하고 있고, 업스테이지는 솔라 시리즈를 발전시켜 1천만 명 이상의 국내 사용자를 확보하는 것을 목표로 하고 있다. SK텔레콤은 포스트 트랜스포머 모델을 전면에 내세우며 B2B와 B2C 시장을 동시에 겨냥한다. NC AI는 50개 이상의 기관을 참여시키며 도메인 특화 플랫폼을 구축하려 하고, LG AI연구원은 기존 엑사원 모델을 진화시켜 산업 전반의 AI 전환을 가속한다는 계획을 제시한다.

필자는 아주 우연한 기회를 통해 이 프로젝트의 초기 단계에서 한 스타트업의 기술 전략 자문으로 참여한 바 있다. 국가 AI 챔피언십에 도전한 여러 기업 가운데 한 팀과 함께 준비하면서, 그동안 머릿속에서만 존재하던 '독자 AI'라는 개념이 훨씬 더 현실적으로 다가왔다. 언론에서 반복되던 국가 전략의 구호가 아니라, 실제 기업이 직면하는 기술적 과제와 시장 적용 가능성, 그리고 한정된 자원 속에서 반드시 내려야 하는 선택의 문제로 전환된 것이다. 이 과정에서 필자는 독자 AI가 단순히 국가적 명분에 머무는 주제가 아니라는 사실을 깨달았다. 정부와 공공에 AI 주권은 전략적으로 필요한 명분일 수 있으나, 스타트업에 이는 곧 생존과 성장을 가르는 현실적 과제이며, 실제 시장에서 성과를 낼 수 있느냐는 더 직접적이고 냉정한 질문으로 다가온다.
독자 AI 파운데이션, 주권의 본질은 활용이 아닌 통제에 있다
이른바 독자 AI 파운데이션 모델이란, 알고리즘을 설계하고 데이터를 수집·정제한 뒤 방대한 학습과 검증, 그리고 추론까지 전 과정을 스스로 수행해야 비로소 의미를 갖는다. GPT, Gemini, Claude 같은 LLM이나 Whisper, SAM 등 거대 모델이 모두 이런 방식으로 만들어졌다. 이 단계에는 수백에서 수천만 단위의 GPU 연산 자원, 고유한 데이터셋, 그리고 이를 떠받칠 연구 개발 인력이 필요하며, 사실상 Google이나 OpenAI 같은 글로벌 빅테크 기업만이 감당할 수 있는 수준이다. 그래서 많은 기업이 실제로 접근하는 방식은 그보다 한 단계 아래에 존재한다. 이미 공개된 아키텍처와 알고리즘을 활용하고, 자체 데이터를 학습시켜 자신들의 모델을 만드는 것이다. 트랜스포머, U-Net, LSTM 같은 구조를 가져와 자사 도메인 데이터에 맞게 학습시키는 경우가 대표적이다. 핵심 기술은 일부 외부에 의존한다고 볼 수 있지만, 데이터와 적용을 자체적으로 주도한다는 점에서 독자성을 확보하려는 시도라 할 수 있다. 또 다른 접근은 이미 학습이 끝난 모델을 가져다 파이프 라인을 조립하는 방식이다. Whisper로 음성을 텍스트로 변환한 뒤 Gemini로 요약을 하고, 이를 PDF 리포트로 만드는 식이다. 모델을 새로 만드는 것은 아니지만, 전처리와 후처리를 엮어 산업 현장에 적합한 결과물을 만들어낸다. 마지막은 ChatGPT나 Gemini API처럼 완성된 모델을 단순히 호출해 서비스에 붙이는 방식이다. 프롬프트를 설계하거나 음성 합성 API를 연결해 서비스에 얹는 정도다. 기술적으로는 가장 단순하지만, 사용자 경험과 기획 차원에서는 여전히 의미가 있다. 실제로 많은 스타트업이 초기 제품을 이 단계에서 출발시킨다.

다만 여기서 짚고 넘어가야 할 점이 있다. 일반적으로 독자 AI 파운데이션, Sovereign AI라고 할 수 있는 기술의 범위는 2단계까지를 말한다. 즉, 알고리즘과 아키텍처를 직접 설계해 모델을 길러내거나, 기존 구조를 가져와 자체 데이터를 학습시키는 수준까지를 포함한다. 이 단계까지는 데이터와 학습 과정, 그리고 모델의 성능에 대한 통제권을 확보할 수 있기 때문에 주권의 의미가 성립한다. 그러나 그 이후 단계, 즉 API와 플랫폼 활용부터는 이야기가 달라진다. 이때부터는 외부 모델이나 인프라 의존도가 급격히 높아진다. Whisper, Gemini, GPT 등 외부 기업이 솔루션으로 제공하는 API를 가져다 조합하는 수준은 기술적으로 유용하고 산업적 가치는 충분하지만, 본질적으로는 주권을 확보했다고 보기는 어렵다. 응용 서비스 단계로 가면 그 의존도는 더 커지고, 결과적으로 자율성보다는 외부 기술 위에 얹은 기획과 운영의 차별화로 무게 중심이 옮겨간다. API를 호출하고 서비스를 꾸미는 것은 분명 가치 있는 활동이지만, 그것은 주권의 문제라기보다는 활용의 영역이다.
한국판 ChatGPT는 답이 될 수 없다
언론과 정부 정책에서 강조되는 그림은 대체로 '한국판 ChatGPT'에 가깝다. 온 국민이 언제 어디서나 자유롭게 ChatGPT와 같은 AI 도구를 사용할 수 있게 하는 것, 그리고 OpenAI·Google 등 해외 기업에 의존하지 않는다는 점에서 이러한 관점이 틀린 것은 아니다. 그러나 조금만 들여다보면 진정한 '소버린 AI'의 의미는 그보다 훨씬 더 깊다는 사실을 알 수 있었다. 독자 AI의 핵심은 특정 모델 하나를 보유하는 데 있지 않다. 데이터를 스스로 관리하고, 인프라를 자립적으로 확보하며, 산업과 제도를 함께 설계하는 체계 전체를 포함한다. 그래야만 외부에 종속되지 않고 스스로의 길을 갈 수 있다. 필자가 지난 수개월간 현장에서 만난 전문가들도 비슷한 이야기를 했다. AI 주권 확보는 분명히 중요하고 필요하지만, 지금과 같은 추진 방식에는 '쇼맨십'의 색채가 짙다는 것이다. 단순히 성과를 보여주기 위한 이벤트성 접근이라면, 결국 남는 것은 '국가대표 모델'이라는 이름뿐일 수 있다. 주권의 본질은 성과물이 아니라, 데이터·인프라·생태계 토대 위에서 실질적인 자율성을 확보하는 데 있다.
이 지점에서 스타트업에 던져지는 질문도 분명해진다. 정부는 AI 주권 확립을 위해 100조 원을 투입하겠다고 밝혔지만, 실제 그 규모로 OpenAI나 Google과 동등한 수준의 모델을 창조해내는 것은 현실적으로 불가능에 가깝다. 이는 우리나라의 기술 역량이나 인재 수준이 부족해서라기보다, 초거대 AI 모델을 구현하는 데 필요한 자원이 절대적으로 제한적이기 때문이다. GPT 수준의 초거대 모델 학습에 필요한 데이터, GPU, 네트워크 인프라, 전력, 전문 인력 등을 고려하면, 현재 국내에서 글로벌 빅테크 수준의 자원을 단독으로 확보·운영하기에는 구조적으로 한계가 뚜렷하다는 말이다. 그렇다면 우리 스타트업들은 무엇에 집중해야 하는 것일까.
국내 스타트업이 집중해야 할 네 가지 전략
국내 스타트업에 필요한 것은 초거대 모델을 만드는 경쟁이 아니라, 문제를 정의하고 해법을 설계하는 실행 전략이다. 현실적으로 글로벌 빅테크와 동일한 인프라를 갖추는 것은 불가능하지만, 오히려 그 제약이 스타트업에는 차별화의 기회가 된다.
첫째, 문제 정의에 집중해야 한다. 국내 스타트업이 글로벌 빅테크와 경쟁하기는 현실적으로 어렵다. 따라서 모델의 크기 경쟁이 아니라, 해결해야 할 문제를 얼마나 정확히 정의할 수 있는가가 경쟁력이 된다. 산업별·현장별로 존재하는 세부적이고 복잡한 문제, 예를 들어 의료·법률·금융·시니어 헬스케어와 같은 고도화된 도메인 문제는 한국 스타트업만이 더 깊이 이해할 수 있다. 문제를 정확하게 정의할수록 솔루션은 날카로워지고, 모델 자체보다 서비스와 실행력에서 승부를 걸 수 있다.
둘째, 특화 데이터 확보에 주력해야 한다. 초거대 모델을 직접 만드는 것보다, 도메인 특화 모델을 위한 데이터를 확보하는 전략이 더 효과적이다. 의료, 법률, 금융, 교육 등 각 산업군에서 실제 현장에서 발생하는 양질의 데이터셋을 수집하고, 이를 정제·가공해 활용하는 것이 중요하다. 특히 정부가 추진하는 공공 데이터 개방 정책과 연계하거나, 민간 차원에서 실사용 데이터(RWD, Real World Data)를 확보한다면 장기적으로 가장 강력한 무기가 된다.
셋째, 산업 현장 기반의 빠른 실증(PoC)에 집중해야 한다. 스타트업의 강점은 속도와 실험 능력이다. 정부와 대기업이 플랫폼과 인프라를 설계한다면, 스타트업은 그 위에서 빠른 실증을 통해 시장을 먼저 선점해야 한다. 병원, 복지기관, 금융기관, 교육기관 등 실제 산업 현장에서 API·모델을 연동해 실제 사용자 데이터를 기반으로 성능을 검증하는 것이 핵심이다. 이렇게 빠른 시장 진입과 반복적 실험을 통해 확보한 현장 데이터와 피드백이 스타트업의 차별화를 가능하게 한다.
넷째, 글로벌 틈새 시장 공략과 수익 기반 자금 확보 전략을 병행해야 한다. 보여주기 식의 "한국판 ChatGPT"를 만드는 경쟁에서 벗어나, 한국의 스타트업만 해결할 수 있는 문제를 중심으로 해외시장을 공략하는 전략이 필요하다. 일본, 싱가포르, UAE 등 고령화·규제·언어 장벽이 존재하는 지역은 오히려 한국 스타트업에 유리한 환경이다. 현지 제도·문화·데이터 환경을 이해하고 차별화된 솔루션을 빠르게 공급하면, 초기부터 유효 수익 모델을 확보할 수 있다. 이 과정에서 글로벌 빅테크와는 경쟁이 아니라 전략적 협력을 통해 시장 진입 장벽을 낮추는 것이 효과적이다. 특히 해외 틈새 시장에서 수익을 창출하면, 이를 다시 R&D 투자와 데이터 확보에 재투자하여 추가 자금 확보까지 가능하다. 이는 국내에서 단순히 정부 지원금에 의존하는 것보다 훨씬 지속 가능한 성장 경로가 될 수 있다.
스타트업의 도전 정신이야말로 한국 AI 생태계의 숨은 자산
사실 이번 프로젝트를 지켜보면서 가장 아쉬웠던 점은 단 하나였다. 독자 AI 파운데이션 모델이라는 이름이 무엇을 의미하든, 필자는 실로 많은 스타트업이 이 무대에 도전장을 내밀기를 기대했다. 네이버, SKT, LG 등 대기업과 규모 면에서 경쟁이 되지 않더라도, 열정적인 창업팀들이 컨소시엄을 이루어 수백 개 기업이 시끌벅적하게 경합을 벌이고, 그 과정이 마치 국민적 축제처럼 사회 전체를 흔드는 모습을 상상했다. 일종의 '프로듀스 101' 같은 오디션 무대가 국가 단위에서 펼쳐진다면, 그것만으로도 한국 AI 생태계에는 엄청난 활력이 생겼을 것이다. 그러나 현실은 그와 달랐다. 이른바 AI를 한다고 하는 대부분의 스타트업들은 몸을 사렸고, 도전장을 낸 곳은 극히 소수에 불과했다. 시간낭비라고 생각한 것일까? 그들만의 리그라고 생각해서 처음부터 포기한 것일까? 스타트업으로서 내린 현명한 선택인 것일까?
그러나 필자가 자문으로 참여했던 한 스타트업은 특별했다. 이들은 나름대로의 신념과 스토리를 갖추고 몇몇 유관 기관과 어렵사리 컨소시엄을 구축하였으며, 누가 봐도 '계란으로 바위 치기'에 가까운 현실의 한계에 주저하지 않고 과감히 도전에 뛰어들었다. 열흘 남짓한 시간 동안 꼬박 밤을 새우며 두꺼운 백과사전 한 권 분량에 해당하는 사업 계획서를 써냈다. 준비 과정에서 수많은 어려움이 있었고, 한때는 모든 노력이 무너질 뻔한 사건도 있었지만, 결국 서로를 붙잡고 끝까지 버텨냈다. 선정 여부와 상관없이 이 경험 자체는 팀의 소중한 자산이 되었을 것이다.
더 자세한 이야기를 하고 싶지만, 그것은 언젠가 이들이 직접 성공을 거둔 뒤 스스로 자랑할 기회로 남겨 두고 싶다. 다만 분명한 것은, 필자가 본 것은 단순한 사업 계획서가 아니라 기업가 정신 그 자체였다는 점이다. 불가능해 보이는 목표에도 과감히 뛰어들고, 넘어져도 다시 일어나며, 끝까지 버텨내는 힘, 바로 그 정신이야말로 지금 한국 스타트업에 가장 절실하게 필요한 자원이다. GPU나 데이터셋, 자본보다 먼저 갖추어야 할 토대다. 그리고 필자는 이번 경험을 통해 그것이 여전히 살아 있다는 사실을 확인할 수 있었다.
시기 적절하게도, 본 칼럼을 퇴고하는 중에 한 기사를 접했다. 독자 AI 파운데이션 모델 지원 프로젝트에서 탈락한 팀들을 대상으로 2차전을 준비한다는 내용이었다. 앞서 이야기한 그 스타트업 팀원들의 반응이 특히 인상적이었다. 당황스러운 상황에서도 동요하지 않고, 조용히 다시 참여할 준비를 이어가고 있었다. 선정 가능성을 따지기보다 결과와 무관하게 도전을 당연한 선택으로 받아들이는 태도였다. 바로 이런 자세가 필요하다. 불확실한 시장, 한정된 자원, 언제든 변하는 정책 환경 속에서도 포기하지 않고 다시 도전하는 힘, 그것이야말로 스타트업의 본질이다.
필자가 이번에 전하고 싶은 메시지는 단순하다. 명분보다 시장, 기술보다 실행, 속도보다 방향이 중요하다는 것이다. 초거대 AI모델 경쟁에서 글로벌 빅테크를 따라잡는 것은 현실적으로 불가능하다. 그러나 한국의 스타트업은 문제를 정확히 정의하고, 특화된 데이터를 확보하며, 산업 현장에서 실질적인 가치를 창출하는 전략으로도 충분히 승부할 수 있다. 기업가 정신은 여전히 살아 있고, 그것이 바로 우리나라의 AI 생태계를 움직이는 가장 중요한 자산이다. 우리는 GPU도, 데이터도, 자본도 부족할 지 모르지만, 다시 도전하는 힘만은 스스로 선택할 수 있다. 다가올 AI 시대를 바꾸는 것은 기술의 크기가 아니라, 다시 도전하는 사람들의 크기다. 그리고 그 도전들이 모여, 마침내 우리나라의 미래를 새롭게 써 내려갈 것이라고 믿어 의심치 않는다.