내가 AI 도구를 3개월 써본 솔직 후기

Q: ChatGPT - 역시 1등은 이유가 있다

3개월 동안 가장 많이 열었던 탭은 단연 ChatGPT였어요. 이유는 간단해요. 대화가 자연스럽고, 막혀도 이어서 물어보기가 쉬워요.

Q: Gemini - 리서치할 땐 이게 제일 빠르다

Google Gemini는 특히 리서치 작업할 때 강해요.

AI 인공지능 기술 이미지

시작은 ChatGPT였다

작년 11월부터 본격적으로 AI 도구들을 써보기 시작했어요.

사실 처음엔 ChatGPT만 쓸 생각이었거든요. 근데 주변에서 Claude도 좋다더라, Gemini는 구글이라 검색이 강하다더라, Copilot은 무료라더라... 이런 얘기들 듣다 보니까 "아 그냥 다 써보자" 싶더라고요.

그래서 저는 3개월간 ChatGPT, Claude, Gemini, Copilot 이렇게 4개를 돌아가면서 실제 업무에 써봤어요. 개발 5년 차 입장에서 유료 결제도 해보고, 무료 버전도 써보고, 같은 작업을 각 도구에 던져보면서 비교했어요.

지금부터 진짜 솔직하게 풀어볼게요. 광고 없는 후기입니다.

ChatGPT - 역시 1등은 이유가 있다

ChatGPT 사용 화면 이미지

3개월 동안 가장 많이 열었던 탭은 단연 ChatGPT였어요. 이유는 간단해요. 대화가 자연스럽고, 막혀도 이어서 물어보기가 쉬워요.

제가 주로 쓴 용도는 이렇습니다:

코딩 질문

Python으로 크롤러 짜다가 requests.exceptions.SSLError 뜨면 바로 복붙해서 물어봐요. 제 경험상 에러 메시지 그대로 넣으면 정확한 해결책 나오는 비율이 약 85~90% 정도예요. 나머지 10~15%는 제 환경 문제거나 버전 이슈인 경우가 많았어요.

블로그 글 초안

키워드 3개랑 타깃 독자만 던져주면 글 구조를 잡아줘요. 물론 그대로 쓰진 않아요. 저는 초안을 50% 정도만 가져오고 나머지는 제 말투로 다시 쓰는 방식으로 씁니다.

번역 + 맥락 설명

영어 공식 문서 읽다가 막히면 바로 물어봐요. 특히 기술 용어가 많은 RFC 문서나 API 레퍼런스는 구글번역으로는 뉘앙스가 다 죽는데, ChatGPT는 맥락까지 잡아줘서 훨씬 나아요.

장점

대화 흐름이 자연스러워요. 한 주제를 여러 번 이어서 질문할 때 맥락을 잘 기억해요
창의적인 답변을 잘 줘요. 아이디어 브레인스토밍할 때 유용해요
플러그인이 많아서 웹 검색, 이미지 생성, 파일 업로드 다 돼요
업데이트 빠르고 모델 선택지가 많아요

단점

최신 정보에서 가끔 환각(Hallucination)이 나와요. 특히 날짜나 통계 수치는 꼭 확인해야 해요
GPT-4o 쓰려면 유료 플랜 ($20/월, 약 2만 8천 원) 결제 필요해요
한국어 문장이 가끔 어색해요. 특히 긴 문단에서 조사가 틀릴 때 있어요

Claude - 글쓰기랑 코드 리뷰는 이게 짱이에요

글쓰기 작업 화면

Claude Sonnet 4.5를 주로 써봤어요.

솔직히 처음에는 "ChatGPT랑 비슷하겠지" 했는데, 긴 문서 처리하는 순간 생각이 완전히 바뀌었어요.

20페이지짜리 기술 스펙 문서를 통째로 넣고 "이 중에서 인증 관련 파트만 요약해줘"라고 했더니 5분도 안 걸려서 정리해줬어요. ChatGPT는 파일 크기 제한 때문에 나눠서 넣어야 했는데 Claude는 한 방에 처리됐어요.

주요 용도

긴 문서 분석

200페이지짜리 논문도 읽어요. 진짜로. 저는 오픈소스 라이브러리 CHANGELOG 전체를 붙여 넣고 "Breaking Change 목록만 뽑아줘" 하는 식으로 자주 씁니다.

코드 리뷰

이게 Claude를 유료로 쓰는 이유예요. 제 코드 300줄 올려놓고 "이거 코드 리뷰해줘"라고 하면 단순히 "이렇게 바꿔봐"가 아니라 "왜 문제인지"까지 설명해줘요. 가끔 제가 미처 못 본 버그도 잡아줘요. 더 자세한 사례는 AI로 코드리뷰 하는 법 글에서 따로 정리했어요.

한국어 글쓰기

AI 도구 4개 중에서 한국어 품질이 가장 높아요. 조사 오류가 눈에 띄게 적고, 문장 흐름이 자연스러워요.

장점

긴 글 처리 능력이 압도적이에요 (최대 20만 토큰)
한국어 품질 4개 중 1위
환각이 상대적으로 적어요
코드 리뷰, 문서 요약에서 체감 품질이 높아요

단점

응답 속도가 ChatGPT보다 느려요. 긴 답변은 더 기다려야 해요
이미지 생성 안 돼요
유료 플랜 ($20/월)이어야 좋은 모델 써요
최신 정보 검색은 Gemini만 못해요

Gemini - 리서치할 땐 이게 제일 빠르다

구글 워크스페이스 화면

Google Gemini는 특히 리서치 작업할 때 강해요.

구글이잖아요. 실시간 웹 검색이 기본으로 붙어 있어서 "2026년 1분기 AI 투자 트렌드 정리해줘"라고 하면 최신 기사들 찾아서 출처까지 달아줘요. ChatGPT나 Claude는 학습 데이터 마감 이후 정보는 없지만 Gemini는 오늘 나온 뉴스도 찾아줘요.

주요 용도

최신 정보 검색

라이브러리 최신 버전 릴리즈 노트, 업계 동향, 경쟁사 소식 찾을 때 써요. "오늘 기준 Next.js 최신 버전이 뭐야?"라고 물으면 바로 알려줘요.

구글 워크스페이스 연동

Gmail, Google Docs랑 연결되면 진짜 편해요. Docs에서 바로 쓸 수 있어서 보고서 작성할 때 창 왔다갔다 안 해도 돼요.

유튜브 영상 요약

유튜브 링크 넣으면 내용 정리해줘요. 긴 기술 발표 영상을 10분 만에 요약 볼 때 씁니다.

장점

실시간 웹 검색 기본 제공 (다른 도구들은 제한적이거나 유료)
컨텍스트 윈도우가 100만 토큰 (엄청 긴 문서 가능)
구글 생태계랑 찰떡궁합
무료 버전도 생각보다 쓸 만해요

단점

대화 흐름이 좀 뚝뚝 끊기는 느낌이에요. 연속 대화 품질은 ChatGPT가 나아요
코딩 질문은 ChatGPT, Claude만 못해요
구글에 데이터 들어간다는 게 찝찝한 사람은 신중하게 쓰세요

Copilot - 무료로 쓸 수 있는 것 중엔 괜찮아요

코딩 작업 화면

Microsoft Copilot은 솔직히 기대 안 했는데 의외의 용도로 자주 쓰게 됐어요.

무료라는 게 핵심이에요. Edge 브라우저나 Windows에서 기본으로 쓸 수 있어요. ChatGPT 유료 끊기거나, 사용량 제한 걸렸을 때 백업으로 씁니다.

주요 용도

간단한 검색 + 요약

구글 검색 대신 Copilot한테 질문하면 답변이랑 출처가 같이 나와요. "Tailwind CSS v4 주요 변경점이 뭐야?" 같은 질문에는 충분해요.

Microsoft 365 연동

회사에서 Excel, Word 많이 쓰는 사람한테 유용해요. 문서 안에서 바로 써요.

장점

무료예요
Microsoft 생태계 사용자한테 최적화
응답 속도 빨라요

단점

깊이가 부족해요. 복잡한 질문은 피상적인 답 나와요
ChatGPT 기반인데 제한된 버전 느낌이에요
창의적인 작업은 약해요

3개월 사용 비교표

항목	ChatGPT	Claude	Gemini	Copilot
응답 속도	⭐⭐⭐⭐	⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐⭐
코딩 정확도	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐	⭐⭐⭐
한국어 품질	⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐
창의성	⭐⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐	⭐⭐
최신 정보	⭐⭐⭐	⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐
긴 문서 처리	⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐
가격	$20/월	$20/월	$20/월	무료
추천 용도	만능, 코딩, 대화	글쓰기, 코드리뷰, 분석	리서치, 검색	간단 질문

실제로 이런 상황에서 썼다: 3가지 실전 시나리오

이게 이 글에서 제일 솔직한 파트예요. 실제 업무에서 어떻게 썼는지 구체적으로 적을게요.

시나리오 1: Django REST API 디버깅 (2시간 → 25분)

작년 12월, 신규 엔드포인트 붙이다가 IntegrityError: UNIQUE constraint failed가 계속 났어요.

스택트레이스 보면서 혼자 한 시간 넘게 씨름했는데 못 잡았어요. ChatGPT한테 에러 메시지 + 관련 모델 코드 200줄 붙여 넣었더니 3분 만에 "트랜잭션 롤백이 안 되고 있는 것 같다, select_for_update()로 처리해봐"라고 알려줬어요.

해결했어요. 그 다음부터 에러 나면 30분 이상 혼자 안 잡고 바로 물어보는 게 루틴이 됐어요.

# Before: 문제가 됐던 코드
def create_user_record(data):
    if not UserRecord.objects.filter(user_id=data['user_id']).exists():
        UserRecord.objects.create(**data)  # race condition 발생

# After: ChatGPT가 제안한 수정
from django.db import transaction

def create_user_record(data):
    with transaction.atomic():
        obj, created = UserRecord.objects.get_or_create(
            user_id=data['user_id'],
            defaults=data
        )
    return obj, created

시나리오 2: 150페이지 기술 문서 요약 (8시간 → 1.5시간)

올해 1월, 팀에서 클라우드 마이그레이션 검토하면서 AWS와 GCP 공식 문서를 비교해야 했어요.

합쳐서 150페이지 넘는 PDF인데 혼자 읽으면 꼬박 하루 걸릴 작업이었어요.

Claude한테 두 문서 내용 붙여 넣고 "두 플랫폼의 Kubernetes 관리형 서비스 비교표 만들어줘, 가격, 확장성, 한국 리전 지원 여부 중심으로"라고 했더니 표 + 요약 텍스트가 나왔어요.

물론 제가 원문이랑 대조해서 팩트 체크는 했어요. 틀린 부분 3~4개 있었어요. 그래도 초안 만드는 시간이 8시간에서 1.5시간으로 줄었어요.

시나리오 3: 오픈소스 기여 PR 작성 (막막함 → 완료)

2월에 처음으로 오픈소스 프로젝트에 PR 올리려는데 CONTRIBUTING.md 읽어도 뭘 어떻게 해야 할지 막막했어요.

Gemini한테 "이 프로젝트 CONTRIBUTING.md야, 내가 첫 PR 올리려는데 체크리스트 만들어줘"라고 하고 문서 내용 붙여 넣었어요. 그러자 단계별 체크리스트가 나왔고, 추가로 "비슷한 프로젝트 첫 기여자들이 흔히 하는 실수"까지 정리해줬어요.

PR 올려서 머지됐어요. Gemini 없었으면 아직도 미루고 있었을 것 같아요.

3개월 쓰면서 실망했던 점들

실망한 표정

솔직하게 적을게요.

1. 다 비슷한 소리 한다

"AI 시대 개발자가 살아남는 법"이라고 4개 도구에 똑같이 물어봤어요. 답변 구조가 거의 같아요. "지속적인 학습이 중요합니다", "AI를 도구로 활용하세요" 이런 류의 이야기들. 범용 질문에는 도구 간 차별점이 없어요.

차이가 나는 건 전문 작업일 때예요. 코드 리뷰, 긴 문서 분석, 실시간 검색 같은 거.

2. 한국어는 여전히 약하다

Claude가 제일 낫긴 한데, 그래도 가끔 어색해요. 특히 속담이나 줄임말 섞인 문장은 이상하게 처리할 때 있어요. 영어로 쓰고 번역 돌린 티가 나는 문장들이 있어요.

3. 최신 정보 환각 조심

ChatGPT한테 "2025년 Python 점유율 통계"를 물어봤는데 숫자를 지어낸 적이 있어요. 나중에 Stack Overflow 공식 리포트 찾아보니까 달랐어요. 통계나 사실관계가 들어간 질문은 반드시 원출처 확인하세요.

Stack Overflow 2024 Developer Survey나 State of AI 보고서처럼 공신력 있는 자료는 직접 확인하는 게 맞아요.

4. 창의성 한계

"이 앱에 완전히 새로운 기능 아이디어 10개 줘"라고 하면 나오는 게 다 비슷해요. 게이미피케이션, 알림 최적화, 소셜 기능... 이미 있는 것들이에요. 진짜 참신한 아이디어는 아직 사람이 내야 해요.

놀라웠던 점들

노트북 작업 화면

부정적인 것만 쓰면 불공평하죠.

1. 개발 속도 실제로 빨라짐

측정해봤어요. 11월 한 달 커밋 수랑 2월 한 달 커밋 수 비교하면 약 35~40% 증가했어요. 에러 해결 시간이 줄어든 게 커요. 예전엔 Stack Overflow 뒤지면서 한 시간 썼을 것들이 이제 10~15분으로 줄었어요.

물론 AI가 100% 기여한 건 아니지만, 체감상 생산성이 올라간 건 맞아요.

2. 외국어 장벽이 사라졌다

영어 GitHub 이슈 읽을 때, 일본어 기술 블로그 볼 때 ChatGPT한테 바로 물어봐요. 번역 + 맥락 설명까지 해주니까 이해가 빨라요. 이건 진짜 크게 달라진 부분이에요.

3. 새벽 3시 든든한 동료

새벽에 혼자 코딩하다 막혀도 물어볼 데가 있다는 게 심리적으로 편해요. 사람한테 물어보기 민망한 기초적인 질문도 부담 없이 할 수 있어요.

4. 생각 정리 도구

머릿속 아이디어를 ChatGPT한테 두서없이 덤프하면 구조화해줘요. "이거 이런이런 서비스인데 어떻게 생각해?"로 시작해서 마케팅 전략, 기술 스택, 리스크까지 같이 생각하게 되더라고요.

3개월 후 결론: 내 AI 도구 사용 비율

3개월 뒤 제 실제 사용 패턴이에요.

도구	비율	주요 용도
ChatGPT	65%	코딩, 에러 디버깅, 아이디어 브레인스토밍, 번역
Claude	25%	코드 리뷰, 긴 문서 분석, 한국어 블로그 글쓰기
Gemini	8%	최신 기술 트렌드 검색, 라이브러리 업데이트 확인
Copilot	2%	유료 한도 다 찼을 때 백업

ChatGPT를 가장 많이 쓰게 된 이유는 "만능"이기 때문이에요. 웬만한 건 다 되니까요. 다만 한국어 글쓰기나 코드 리뷰는 Claude로 갈아타는 게 확실히 품질이 좋아요.

개인적인 추천 로드맵이에요:

돈 아끼고 싶다면: Copilot 무료 버전으로 시작
코딩 많이 한다면: ChatGPT 유료 ($20/월 가성비 됨)
긴 문서 분석, 글쓰기 많다면: Claude 유료
리서치, 최신 정보 자주 찾는다면: Gemini

한 가지 확실한 건, AI 도구 하나만 쓰는 건 아깝다는 거예요. 각자 강점이 다르니까 상황에 맞게 골라 쓰는 게 베스트예요.

참고 자료

AI 도구들 성능을 더 깊이 비교하고 싶다면 아래 자료들 참고해보세요.

LMSYS Chatbot Arena Leaderboard - 실사용자 투표 기반 AI 모델 순위
Anthropic Claude 모델 비교 공식 문서 - Claude 모델별 성능 스펙
OpenAI GPT-4o 모델 카드 - ChatGPT 최신 모델 상세 정보

여러분은 어떤 AI 도구 쓰세요?

저는 이렇게 3개월 써봤는데요, 여러분은 어떤 AI 도구가 제일 좋으세요?

특히 "이런 용도로는 이 도구가 최고더라" 같은 경험이 있으면 댓글로 공유해주세요. 저도 모르는 활용법이 있을 것 같아서 궁금해요.

다음 포스팅에서는 ChatGPT vs Claude 1:1 코딩 대결을 더 자세히 해볼게요. 읽어주셔서 감사합니다!

내가 AI 도구를 3개월 써본 솔직 후기

시작은 ChatGPT였다

ChatGPT - 역시 1등은 이유가 있다

Claude - 글쓰기랑 코드 리뷰는 이게 짱이에요

Gemini - 리서치할 땐 이게 제일 빠르다

Copilot - 무료로 쓸 수 있는 것 중엔 괜찮아요

3개월 사용 비교표

실제로 이런 상황에서 썼다: 3가지 실전 시나리오

시나리오 1: Django REST API 디버깅 (2시간 → 25분)

시나리오 2: 150페이지 기술 문서 요약 (8시간 → 1.5시간)

시나리오 3: 오픈소스 기여 PR 작성 (막막함 → 완료)

3개월 쓰면서 실망했던 점들

1. 다 비슷한 소리 한다

2. 한국어는 여전히 약하다

3. 최신 정보 환각 조심

4. 창의성 한계

놀라웠던 점들

1. 개발 속도 실제로 빨라짐

2. 외국어 장벽이 사라졌다

3. 새벽 3시 든든한 동료

4. 생각 정리 도구

3개월 후 결론: 내 AI 도구 사용 비율

참고 자료

여러분은 어떤 AI 도구 쓰세요?

📚 관련 글

💬 댓글