중소기업은 이걸
어떻게 쓰는데
API 호출부터 온프레미스 구축까지. 중소기업이 오픈소스 AI를 도입하는 3가지 경로와, 사내 지식을 AI로 검색하는 현실적 시나리오.
왜 오픈소스 AI인가
중소기업이 AI를 도입하려 할 때, 첫 번째 질문은 "ChatGPT 유료 구독하면 되는 거 아닌가?"다. 물론 된다. 하지만 기업 환경에서는 개인 사용과 다른 문제가 생긴다.
데이터 유출
상용 API를 쓰면 사내 데이터가 외부 서버로 나간다. 계약서, 견적서, 고객 정보, 기술 문서. 유출 시 법적 책임은 우리 회사에 있다.
비용 예측 불가
API는 토큰 단위 과금이다. 직원 50명이 매일 사용하면 월 비용이 수백만 원까지 올라갈 수 있다. 사용량이 늘수록 비용도 비례 증가한다.
서비스 종속
OpenAI가 가격을 올리거나, 약관을 바꾸거나, 서비스를 중단해도 대응이 어렵다. 우리 비즈니스가 남의 서비스에 의존한다.
오픈소스 AI는 이 세 가지 문제에 대한 해답이 된다. 데이터가 외부로 나가지 않고, 비용이 고정되며, 서비스 종속이 없다. Qwen3.5가 이 맥락에서 주목받는 이유는, 오픈 웨이트 모델 중 최고 수준의 성능을 무료로 제공하기 때문이다.
가트너(Gartner)는 2026년 핵심 트렌드로 DSLM(Domain-Specific Language Model)을 지목했다. 범용 대형 모델이 아니라, 특정 업종에 맞춰진 소형 특화 모델이 기업 AI의 주류가 될 것이라는 전망이다. Qwen3 패밀리의 8B/14B 모델은 이 트렌드에 정확히 부합한다. 작고, 빠르고, 우리 데이터로 추가 학습시킬 수 있다.
중소기업에게 AI 도입의 핵심 질문은
"어떤 모델이 좋은가"가 아니다.
"우리 데이터를 어떻게 지킬 것인가"다.
중소기업이 쓸 수 있는 3가지 방식
오픈소스 AI를 도입하는 방법은 3가지다. 각각 비용, 난이도, 보안 수준이 다르다. 회사의 상황에 맞게 선택하면 된다.
대부분의 중소기업에게 현실적인 시작점은 Path A(API 호출)다. 개발자 1명이 하루면 프로토타입을 만들 수 있다. 여기서 효과가 확인되면 Path B(클라우드)로 확장하고, 보안 요구가 높으면 Path C(온프레미스)로 전환하는 단계적 접근이 합리적이다.
| Criteria | API | Cloud GPU | On-Premise |
|---|---|---|---|
| 시작까지 시간 | 1일 | 1~2주 | 1~3개월 |
| 필요 인력 | 개발자 1명 | 개발자 + 인프라 1명 | 개발자 + 인프라 + 보안 2~3명 |
| 데이터 보안 | 외부 전송 | 클라우드 내 격리 | 완전 내부 |
| 모델 크기 | 397B 풀 모델 | 8B~397B 선택 | 8B~32B (GPU 장비에 따라) |
| 확장성 | 즉시 | 유연 | 하드웨어 추가 필요 |
우리 회사 데이터로 학습시키기
Qwen3.5는 범용 모델이다. 모든 분야를 알지만, 우리 회사의 업무를 깊이 아는 것은 아니다. "우리 제품 코드 A-301의 사양이 뭐야?"라고 물으면 모른다고 답한다. 이것을 해결하는 방법이 두 가지 있다.
| Method | Approach | When |
|---|---|---|
| RAG | 문서를 벡터 DB에 저장하고, 질문 시 관련 문서를 찾아 AI에게 전달 | 대부분의 경우 이것으로 충분. 문서가 바뀌어도 DB만 업데이트하면 된다 |
| 파인튜닝 | 모델 자체에 우리 데이터를 추가 학습시킴 | 특수 용어, 업계 관행, 특정 말투가 필요할 때. RAG로 해결 안 되는 경우에만 |
중요한 점은, 대부분의 중소기업에게는 RAG만으로 충분하다는 것이다. 파인튜닝은 데이터 준비, 학습 인프라, 모델 평가에 상당한 리소스가 들어간다. 반면 RAG는 문서를 벡터 DB에 넣기만 하면 바로 쓸 수 있다. 4편에서 다룬 RAG 파이프라인이 기업 환경에서도 동일하게 적용된다.
Qwen3 패밀리의 8B/14B 모델이 여기서 빛을 발한다. 가트너가 주목한 DSLM(도메인 특화 언어 모델) 트렌드에 맞게, 거대한 범용 모델 대신 작고 빠른 모델을 우리 업종에 맞춰서 쓰는 전략이다. 8B 모델은 RTX 4060 하나면 충분하다. 서버 한 대에 여러 모델을 동시에 올릴 수도 있다.
고객 응대
FAQ, 제품 매뉴얼, 이전 문의 기록을 RAG로 연결. 고객이 질문하면 기존 답변 데이터에서 최적 답을 찾아 제공한다.
기술 문서
설계 문서, 테스트 보고서, 코드 주석을 인덱싱. 신입 엔지니어가 "이 모듈 어떻게 동작해?"라고 물으면 AI가 문서에서 찾아 답한다.
내부 규정/절차
사내 규정집, 업무 프로세스, 인사 규정을 학습. "연차 신청 절차가 어떻게 돼?"에 AI가 즉시 답변. HR팀의 반복 업무를 줄인다.
사내 지식 관리 시스템 구축 시나리오
이론은 충분하다. 실제로 중소기업에서 RAG 기반 사내 지식 검색 시스템을 구축하는 시나리오를 살펴보자. 직원 30~50명 규모의 IT 서비스 기업을 가정한다.
| Item | Estimate |
|---|---|
| 구축 기간 | 2~4주 (개발자 1명 기준, 파트타임) |
| 하드웨어 | GPU 서버 1대 (RTX 4070 이상) 또는 기존 워크스테이션 활용 |
| 소프트웨어 비용 | 0원 (Ollama, Qwen, ChromaDB, Python — 모두 무료) |
| 월 운영 비용 | 전기세 + 인력 일부 (서버 관리). API 방식 시 월 3~30만 원 |
| 기대 효과 | 신입 온보딩 시간 단축, 반복 질문 응대 자동화, 지식 이탈 방지 |
시작하기 전에 체크해야 할 것
AI 도입은 기술 문제보다 조직 문제가 더 크다. 도구는 준비되었다. 무료이고, 설치하면 바로 돌아간다. 실패하는 이유는 대부분 기술이 아니라 기대 관리, 데이터 준비, 범위 설정에 있다.
AI 도입에 실패하는 중소기업의 공통점은
기술이 부족한 것이 아니다.
문제 정의 없이 도구부터 산 것이다.
정리하면 이렇다. 먼저 해결할 문제를 정한다. "신입 온보딩에 시간이 너무 든다", "고객 문의 응대가 늦다", "기술 문서를 아무도 안 읽는다". 문제가 명확하면, AI는 도구일 뿐이다. Qwen3.5든, Claude든, 어떤 모델이든 문제에 맞게 선택하면 된다.
그리고 2026년 현재, 그 도구가 무료이고, 오픈소스이고, 성능도 충분하다는 것이 핵심이다. 수천만 원의 컨설팅 비용이나, 연간 수억 원의 라이선스 없이도 시작할 수 있다. 개발자 1명, GPU 1장, 4주. 이것이 중소기업 AI 도입의 현실적 최소 단위다.
- 토큰은 AI의 글자, 컨텍스트는 AI의 책상 크기. Qwen3.5는 A4 500~2,000페이지를 한 번에 읽는다
- 397B 풀 모델은 개인 PC에서 불가능하지만, 8B~32B 소형 모델은 Ollama 한 줄이면 실행된다
- 코딩은 유료급에 약간 부족, 대화와 요약은 충분, 에이전트는 오픈소스 중 최강
- Qwen-Agent + MCP + RAG 조합으로 비용 0원 사이드 프로젝트가 가능하다
- 중소기업은 API로 시작하고, 클라우드로 확장하고, 필요 시 온프레미스로 전환한다
AI 도입의 시작은
거대한 투자가 아니다.
해결할 문제를 정하는 것이다.
문제가 정해지면 도구는 이미 준비되어 있다. 무료이고, 오픈소스이고, 오늘 바로 시작할 수 있다.