1. 2026년, 공공기관 IT의 방향은 AX(AI Transformation)
지난 10년간 공공기관 IT 프로젝트의 중심은 SI 구축 → 운영 유지보수였다.
그러나 2025년 이후 정부와 공공기관의 디지털 전략은 **DX(Digital Transformation)를 넘어 AX(AI Transformation)**로 이동하고 있다.
즉 단순한 시스템 구축이 아니라 AI 기반 업무 자동화와 지식 활용 시스템 구축이 핵심이 된다.
대표적인 변화는 다음과 같다.
- 문서 기반 업무 → 지식 기반 AI 시스템
- 검색 시스템 → 질의응답형 AI 시스템
- 정형 데이터 중심 → 비정형 데이터 활용
- 단순 API 시스템 → AI 서비스 플랫폼
이 흐름 속에서 등장하는 핵심 아키텍처가 바로 RAG(Retrieval Augmented Generation) 시스템이다.
2. 왜 공공기관은 RAG 시스템을 필요로 하는가
공공기관의 가장 큰 특징은 문서 중심 조직이라는 점이다.
예를 들어 다음과 같은 데이터가 존재한다.
- 정책 문서
- 업무 매뉴얼
- 법령
- 내부 지침
- 회의록
- 보고서
- 민원 데이터
- 연구 자료
이 데이터들은 대부분 PDF, HWP, DOC, 텍스트 문서 형태로 존재한다.
문제는 이것이 검색은 가능하지만 이해는 어렵다는 점이다.
예를 들어 기존 시스템은 다음 수준에 머문다.
결과:
PDF 문서 30개
하지만 RAG 시스템은 다음과 같이 동작한다.
산림 복원 정책의 주요 목표는 무엇인가?
AI 답변:
정책 목표는 다음 세 가지입니다.
1. 산림 생태계 복원
2. 탄소 흡수량 확대
3. 지역 생물 다양성 확보
출처:
2024 산림 정책 보고서
즉 문서를 읽어주는 AI 시스템이 된다.
3. RAG 시스템 기본 구조
RAG 시스템은 다음 4개 레이어로 구성된다.
↓
AI Application Layer
↓
Vector Search Layer
↓
LLM Layer
↓
Data Layer
각 레이어의 역할은 다음과 같다.
1) Data Layer
데이터 저장 영역
예시
- PostgreSQL
- S3 / Object Storage
- Elasticsearch
- Document Repository
저장 데이터
- 정책 문서
- 매뉴얼
- 법령
- 보고서
2) Vector Search Layer
문서를 의미 기반 검색으로 변환하는 레이어
기존 검색
RAG 검색
사용 기술
- pgvector
- Elasticsearch vector
- Milvus
- Weaviate
3) LLM Layer
AI 모델이 실제 답변을 생성한다.
예시
- OpenAI
- Claude
- Gemini
- Llama
LLM은 단독으로 사용하면 환각(Hallucination) 문제가 발생한다.
그래서 반드시 RAG 구조와 결합해야 한다.
4) AI Application Layer
실제 사용자 서비스 영역
예시
- 공공기관 업무 챗봇
- 민원 질의 시스템
- 정책 분석 시스템
- 내부 업무 보조 AI
이 레이어는 보통 다음 기술로 구현된다.
- Python (FastAPI)
- LangChain / LlamaIndex
- Spring Boot API
- React / Next.js
4. 공공기관 RAG 시스템 아키텍처 예시
실제 프로젝트에서 많이 등장할 구조는 다음과 같다.
│
▼
API Gateway
│
▼
AI Service (Python)
│
├─ RAG Pipeline
│ ├ Document Loader
│ ├ Text Chunking
│ ├ Embedding
│ └ Vector Search
│
▼
Vector DB
(pgvector / elasticsearch)
▼
LLM API
(OpenAI / Claude / Local LLM)
여기서 핵심은 RAG Pipeline이다.
5. RAG Pipeline 설계 패턴
실무에서 가장 많이 쓰는 구조는 다음이다.
Step 1 Document Ingestion
문서 수집
DOC
HWP
HTML
DB
Step 2 Text Chunking
문서를 작은 단위로 나눈다.
500 ~ 1000 tokens
이 과정이 중요한 이유는
- 검색 정확도
- LLM 입력 제한
과 관련이 있기 때문이다.
Step 3 Embedding
텍스트를 벡터로 변환한다.
예시 모델
- text-embedding-3-large
- BGE
- E5
결과
Step 4 Vector Search
사용자 질문을 벡터로 변환하고
으로 관련 문서를 찾는다.
Step 5 LLM Answer Generation
검색된 문서를 LLM에게 전달한다.
Context:
문서 내용
Question:
사용자 질문
LLM이 최종 답변을 생성한다.
6. 공공기관에서 RAG 프로젝트가 돈이 되는 이유
공공기관은 데이터는 많지만 활용이 부족하다.
그래서 다음 프로젝트들이 계속 등장한다.
1 내부 업무 AI
예시
- 법령 질의 시스템
- 정책 문서 검색 AI
- 업무 매뉴얼 챗봇
2 민원 AI
예시
- 국민 질의 응답 시스템
- 정책 상담 챗봇
3 연구 데이터 AI
예시
- 보고서 분석 AI
- 정책 분석 시스템
결국 공공기관 AI 프로젝트의 핵심은 다음이다.
그리고 그 기술의 중심이 RAG 시스템이다.
7. 개발자의 역할도 바뀐다
이제 개발자는 단순 코더가 아니다.
앞으로 필요한 역량은 다음과 같다.
기존 개발자
Service
Repository
CRUD
AI 시대 개발자
Data Pipeline 설계
Prompt Engineering
RAG Architecture
즉 역할이 코더 → 시스템 설계자로 바뀐다.
결론
2026년 공공기관 IT의 핵심 키워드는 다음 세 가지다.
RAG System
AI Service Platform
앞으로 공공기관 프로젝트는 단순한 웹 시스템이 아니라
으로 바뀔 가능성이 높다.
그리고 그 중심에는 RAG 기반 AI 시스템 아키텍처 설계 능력이 있다.
'Product & Solution' 카테고리의 다른 글
| 10조 원 공공 AI 시장, SI 개발자가 ‘솔루션’으로 돈 버는 법 (0) | 2026.03.06 |
|---|---|
| AI 서비스 경쟁력은 모델이 아니라 데이터·서비스 아키텍처에서 결정되는가 (0) | 2026.03.06 |
| 개발자가 마케팅을 이해해야 하는 이유 (Product Engineer 관점) (0) | 2026.03.05 |
| Claude Code vs IntelliJ AI Assistant (0) | 2026.02.26 |
| Cursor 무료 플랜을 “최적화”해서 쓰는 법 (0) | 2026.02.26 |
