AI Tools &amp; Review

#GPT-5.6#iris-alpha#OpenAI

GPT-5.6 'iris-alpha' 유출 완전 정리: 1.5M 컨텍스트·Polymarket 89%·6월 출시설

OpenAI GPT-5.6가 Codex 로그에서 포착됐습니다. 1.5M 컨텍스트와 6월 출시설, Polymarket 89% 베팅까지 '유출'과 '사실'을 구분해 정리했습니다.

2026-06-19

#Claude Fable 5#Claude Mythos 5#Anthropic

Claude Fable 5 완전 정리: Mythos 첫 공개·6/22까지 무료·Opus 4.8 2배 가격 [2026-06]

6/9 출시 Claude Fable 5 완전 분석. Mythos 클래스 첫 공개·$10/$50/M·6/22까지 Pro 플랜 무료·5%만 Opus 4.8 폴백.

2026-06-10

#Claude Opus 4.8#Anthropic#AI 코딩

Claude Opus 4.8 완전 정리: 코드 결함 4배 감소·Fast Mode 3배 저렴 [2026-05]

5월 28일 출시된 Claude Opus 4.8 완전 분석. SWE-Pro 69.2%·코드 결함 4배 감소·Fast 모드 3배 저렴 — 4.7 대비 변화 총정리.

2026-05-31

AI Tools & Review📖 22분

Cursor 3.5 Shared Canvases 완전 정리: 에이전트 대시보드로 협업·PR 리뷰 [2026-05]

Cursor 3.5가 5월 20일 Shared Canvases를 공개했습니다. 대시보드를 링크 하나로 팀과 공유하고, PR 리뷰·멀티 에이전트 관리까지 실사용으로 정리했습니다.

2026-05-27

#Cursor 3.5#Shared Canvases#AI 코딩 에디터

#Kimi K2.6#Qwen 3.6 Max-Preview#오픈소스 LLM

Kimi K2.6 vs Qwen 3.6 Max-Preview: 1T 모델 두 개, 정반대 전략 [2026-05]

Kimi K2.6 vs Qwen 3.6 Max-Preview 완전 비교. SWE-bench·가격·오픈가중치 — 같은 날 출시된 1T 모델 두 개가 정반대 전략을 택한 이유.

2026-05-16

#Cursor 3.3#AI 코딩 에디터#multitask

Cursor 3.3 완전 정리: /multitask 서브에이전트·Bugbot 자가학습·취약점 스캐너 [2026-05]

Cursor 3.3 (5월 7일) 새 기능 정리: /multitask 비동기 서브에이전트, Bugbot 자가학습, 취약점 스캐너를 실사용 관점에서 분석합니다.

2026-05-13

#Xiaomi MiMo#MiMo-V2.5-Pro#오픈소스 LLM

Xiaomi MiMo-V2.5-Pro 완전 정리: 오픈소스 1T LLM이 Claude Opus 4.6 앞서다 [2026]

Xiaomi MiMo-V2.5-Pro가 SWE-bench 57.2%로 Claude Opus 4.6을 앞섰습니다. $1/M 오픈소스 1T LLM 완전 정리.

2026-05-09

#Windsurf#Devin Review#AI 코드리뷰

Windsurf Devin Review: IDE 코드리뷰 완전 정리 [2026-05]

2026년 5월 Windsurf Devin Review 개방. SWE-check 무료·GPT-5.5 심층 차이, 가이드.

2026-05-08

#Claude Code#Claude Code 업데이트#MCP

Claude Code 5월 업데이트 총정리: 플러그인 URL 설치·세션 ID·MCP 메모리 누수 수정 [2026]

Claude Code v2.1.132 5월 업데이트 총정리. MCP 10GB 메모리 누수 수정·--plugin-url·Ctrl+R 전체 검색 등 핵심 변경사항 한눈에 정리했습니다.

2026-05-07

AI Tools & Review📖 19분

Claude Managed Agents 완전 정리: Dreaming·Outcomes·멀티 에이전트 [2026-05]

Code w/ Claude 2026 발표: 에이전트가 이전 세션을 복기하는 Dreaming, 성공 루브릭 Outcomes, 멀티 에이전트 병렬 실행까지 정리했습니다.

2026-05-07

#Claude Code#Managed Agents#Dreaming

#GPT-5.5#GPT-5.5 Instant#ChatGPT 업데이트

GPT-5.5 Instant: 환각 52.5% 감소·ChatGPT 기본 모델 교체 완전 정리 [2026-05]

ChatGPT 기본 모델이 GPT-5.5 Instant로 바뀌었습니다. 환각 52.5% 감소·AIME 81.2점·메모리 소스 공개까지, 달라진 것을 정리했습니다.

2026-05-06

#Mistral Medium 3.5#Vibe Agent#오픈소스 LLM

Mistral Medium 3.5 완전 정리: 128B 오픈웨이트·Vibe 클라우드 에이전트 vs Claude Code — 개발자 선택 가이드 [2026-05]

Mistral Medium 3.5가 5월 2일 출시됐습니다. 128B 오픈웨이트로 SWE-bench 77.6%, Vibe 클라우드 에이전트로 비동기 코딩 자동화까지. Claude Code와 무엇이 다른지 비교 정리했습니다.

2026-05-04

#Claude Mythos#Anthropic#Project Glasswing

Claude Mythos Preview 완전 정리: Opus를 뛰어넘은 Anthropic 최강 모델 — 제로데이 자동 발견·SWE 93.9%·왜 일반 공개 안 하나 [2026-04]

Anthropic이 Opus 위에 새 티어를 만들었습니다. Claude Mythos Preview는 SWE-bench 93.9%, 제로데이 취약점 수천 개 자동 발견 — 하지만 일반 API 접근은 막혀 있습니다. Project Glasswing과 함께 왜 이 모델이 조용히 나왔는지, 무엇이 달라졌는지 정리했습니다.

2026-04-27

#DeepSeek V4#DeepSeek V4-Pro#DeepSeek V4-Flash

DeepSeek V4 완전 정리: V4-Pro·V4-Flash — 1M 컨텍스트·오픈웨이트·GPT-5.5 대비 최대 107배 저렴 [2026-04]

DeepSeek이 V4-Pro와 V4-Flash를 동시 출시했습니다. LiveCodeBench 코딩 1위(93.5), MIT 오픈웨이트, 1M 컨텍스트 듀얼 모드 — GPT-5.5 대비 최대 107배 저렴한 가격과 V3.2 마이그레이션 가이드를 정리했습니다.

2026-04-26

#GitHub Copilot#AI 코딩 도구#Copilot Pro

GitHub Copilot 2026년 4월 플랜 개편: 신규 가입 중단·Autopilot 출시·Pro vs Pro+ 전면 비교

GitHub가 4월 20일 Copilot 개인 플랜을 전면 개편했습니다. 신규 가입 중단, Pro 모델 제한, Autopilot 출시까지 — Pro($10)와 Pro+($39) 중 어떤 선택이 맞는지 정리했습니다.

2026-04-25

#Gemini CLI#서브에이전트#AI 코딩 도구

Gemini CLI 4월 업데이트: 서브에이전트·챕터·컨텍스트 압축 완전 정리 [2026]

Gemini CLI v0.38.1에서 서브에이전트 공개 출시. @codebase_investigator 등 기본 에이전트, 병렬 실행, 커스텀 .md 정의까지 — 챕터, 컨텍스트 압축, 터미널 버퍼 등 4월 업데이트 전부 정리했습니다.

2026-04-20

#Gemini API#Google AI#LLM API

Google Gemini API 무료 Pro 종료 완전 정리: Flash만 남은 무료 티어와 개발자 3가지 대응 전략 [2026-04]

2026년 4월 1일부터 Gemini Pro 계열이 무료 티어에서 완전 제거됐습니다. Flash만 무료, 신규 계정은 선불 결제 기본. 변경 내용 전체 정리와 개발자 대응 전략 3가지를 담았습니다.

2026-04-17

DeepSeek R2: 유출 1.2T vs 실제 32B — 더 작지만 AIME 92.7% 달성 [2026 리뷰]

모두가 1.2조 파라미터 괴물을 기다렸다. DeepSeek은 32B 밀집 모델을 내놨고, AIME 2025에서 92.7%를 찍었다.

2026-04-12

#DeepSeek R2#추론 AI#AIME

#meta ai#muse spark#facebook ai

Meta Muse Spark: Facebook·Instagram·WhatsApp에 들어오는 새 AI 모델 [2026 분석]

Meta Superintelligence Labs가 만든 Muse Spark, 5개 플랫폼 동시 탑재. $140억 투자 + MTIA 칩까지, Meta의 AI 판 어떻게 바뀌나.

2026-04-10

#Gemma 4#Google AI#오픈소스 LLM

Google Gemma 4: Apache 2.0 에이전트 전용 오픈소스 모델 [2026 가이드]

Google이 Apache 2.0 라이선스로 Gemma 4를 공개했습니다. 에이전트 워크플로우 전용 설계, Gemini Nano 4의 기반 모델, 6x KV 캐시 압축까지 — 실무 적용 전 알아야 할 것들.

2026-04-07

#GitHub Copilot#Cloud Agent#AI 코딩

GitHub Copilot Cloud Agent 4월 업데이트: 리서치·플랜·커밋 서명 [2026]

GitHub Copilot Cloud Agent가 4월에 대거 업데이트됐습니다. 리서치 모드, 플랜 모드, 커밋 서명, 에이전트 방화벽까지 — 핵심 5가지를 개발자 관점에서 정리합니다.

2026-04-06

AI Tools & Review📖 10분

OpenAI Codex CLI 2026 최신 업데이트: Windows 샌드박스, GPT-5.3-Codex-Spark 1000+ TPS

OpenAI Codex CLI의 최신 업데이트를 정리합니다. Windows 샌드박스 네트워킹, ChatGPT 디바이스 로그인, GPT-5.3-Codex-Spark 초당 1000토큰까지 개발자 관점에서 분석합니다.

2026-04-03

#Codex CLI#OpenAI#GPT-5.3-Codex-Spark

AI Tools & Review📖 21분

J-Pop으로 일본어 배우기: Utakoto로 좋아하는 노래 한 곡이면 단어 100개 마스터

좋아하는 J-Pop YouTube URL만 입력하면 AI가 가사를 분석하고 단어를 추출해서 SRS 플래시카드를 자동 생성합니다. YOASOBI, Ado, 요네즈 켄시 노래로 일본어 어휘를 재미있게 익히는 방법을 소개합니다.

2026-04-02

#일본어 학습#J-Pop#AI

AI Tools & Review📖 11분

Google Lyria 3 Pro: DeepMind의 최신 AI 음악 모델, 3분짜리 곡을 API로 만든다

Google Lyria 3 Pro는 3분짜리 풀 트랙을 생성하는 AI 음악 모델입니다. 구조 인식 작곡, 이미지-투-뮤직, SynthID 워터마크, API 가격까지 Suno/Udio와 비교 분석합니다.

2026-03-31

#Lyria 3 Pro#Google DeepMind#AI 음악

AI Tools & Review📖 12분

Adobe Firefly 무제한 생성 시대: AI 이미지·영상 크리에이티브 올인원 가이드

혹시 사이드 프로젝트 랜딩 페이지에 넣을 이미지 하나 만들려고 Midjourney, DALL-E, Firefly를 번갈아 열어본 적 있으신가요? 저는 있습니다. 꽤 자주요. Photo by Glenn Carstens-Peters on Unsplash | AI 크리에이티브 도구로...

#Adobe Firefly#ai 영상 편집#AI 이미지 생성

AI Tools & Review📖 20분

내가 AI 도구를 3개월 써본 솔직 후기

시작은 ChatGPT였다 작년 11월부터 본격적으로 AI 도구들을 써보기 시작했어요. 사실 처음엔 ChatGPT만 쓸 생각이었거든요. 근데 주변에서 Claude도 좋다더라, Gemini는 구글이라 검색이 강하다더라, Copilot은 무료라더라... 이런 얘기들 듣다 보니까 "아 그냥...

#ai도구#ai비교#AI후기

AI로 음악 만들기: Suno vs Udio 2026년 최신 비교 — 누가 더 잘 만들까?

Suno v5 Studio와 Udio 2026을 직접 써보고 비교했습니다. 음질, 보컬, 조작성, 가격까지 AI 음악 생성기 완벽 비교 가이드 왜 AI 음악 생성기를 찾게 됐나 저는 음악에 대해 아는 게 거의 없습니다. 코드 진행이 뭔지, 믹싱이 뭔지도 잘 모르는...

#AI Music Generator#AI 음악#ai 작곡

Amazon Health AI 에이전트: 프라임 회원 전용 AI 주치의, 의료 AI 서비스의 새 기준

Amazon One Medical의 수석 부사장 Nworah Ayogu는 최근 공식 블로그에서 이렇게 말했습니다. "우리는 Health AI가 단순 챗봇이 아니라, 환자와 의료진 사이의 다리가 되길 원합니다." 처음 이 말을 봤을 때는 또 빅테크의 포장이겠거니 했습니다. 근데...

#AI 에이전트#ai 의료 상담#AI 헬스케어

AI Tools & Review📖 18분

Apple Intelligence 2026 총정리: LLM Siri부터 Gemini 통합까지, 뭐가 달라지나?

"시리야, 지난주에 에릭이 보낸 아이스 스케이팅 관련 이메일 찾아줘." 이 한 문장이 실제로 작동하는 세상이 온다고 합니다. 올해 안에요. 저는 Siri에 대한 기대를 오래전에 접은 사람입니다. "시리야, 타이머 3분"이 Siri와의 대화에서 가장 복잡한 요청이었으니까요....

#ai 비서#apple intelligence#gemini

Cerebras WSE-3 스펙 총정리: 트랜지스터 4조 개·2026년 4월 IPO vs NVIDIA

Cerebras WSE-3 핵심 스펙: 트랜지스터 4조 개, AI 코어 90만 개, 메모리 대역폭 21PB/s. 4월 IPO 일정, NVIDIA 비교, 투자 리스크까지 한눈에 정리.

#Cerebras#WSE-3#AI 칩

Claude Opus 4.6 vs GPT-5.3 Codex — 같은 날 출시된 두 AI, 뭐가 다를까?

2026년 2월 5일, AI 업계에 전례 없는 일이 벌어졌습니다. Anthropic이 Claude Opus 4.6을 공개한 지 불과 20분 만에 OpenAI가 GPT-5.3 Codex로 맞불을 놨습니다. 의도된 타이밍인지, 우연의 일치인지는 모르겠지만 — 확실한 건 2026년 AI...

#Anthropic#claude#CODEX

Cursor가 자체 AI 모델을 만든다: Composer 2의 등장과 코딩 AI 시장 판도 변화

Cursor가 자체 AI 모델을 만든다는 소식을 처음 들었을 때 "무모하다"고 생각했습니다. Anthropic과 OpenAI라는 거인의 어깨 위에서 편하게 수익을 올리던 회사가, 왜 굳이 수천억 원짜리 모델 훈련에 뛰어드는 걸까요. 근데 3월 19일...

#AI 모델#ai 코딩#anysphere

Google Search Live 200개국 확대 + Gemini 3.1 Flash Live: 음성·카메라로 바뀌는 AI 검색의 새 기준

Google이 Search Live를 200개국으로 확대하고 Gemini 3.1 Flash Live 모델을 탑재했습니다. 90개 언어 지원, 카메라 실시간 검색, SynthID 워터마크까지 개발자 관점에서 분석합니다.

#Google Search Live#Gemini 3.1 Flash#AI 검색

Google Workspace Studio 첫인상: AI 에이전트를 직접 만들어 팀과 공유하는 시대

"에이전트 만들어서 공유해봐." 팀 리드가 슬랙에 던진 한마디에 저는 Google Workspace Studio를 처음 열어봤습니다. "또 구글이 뭘 만들었나" 정도의 시큰둥한 기대였는데, 30분 만에 생각이 바뀌었습니다. 코드 한 줄 없이 Gmail에서 특정 패턴의...

#AI 에이전트#gemini#Google AI

GPT-5.2의 40만 토큰 컨텍스트 시대: 긴 문서 처리, 정말 달라졌을까?

GPT-5.2는 40만 토큰 컨텍스트 윈도우로 긴 문서 처리 능력이 확실히 한 단계 올라갔지만, 가격이 40% 인상됐고 실사용에서는 20만 토큰 이후 정확도가 떨어지는 구간이 존재합니다. 결론부터 말씀드리면, "쓸만하지만 만능은 아니다"입니다. GPT-5.2의 40만 토큰 컨텍스트는...

#40만토큰#ai 코딩#claude

GPT-5.4 '가장 정확한 모델' 활용법: 환각 33% 감소, 실무 팩트체킹 워크플로우 만들기

OpenAI의 공식 발표에 따르면, GPT-5.4의 개별 주장(claim)이 거짓일 확률은 GPT-5.2 대비 33% 감소했고, 전체 응답에 오류가 포함될 확률은 18% 낮아졌습니다 (2026년 3월 5일 기준, OpenAI 공식 블로그 ). 숫자만 보면 꽤 인상적입니다. 근데...

#ai 코딩#ai 환각#GPT-5.4

Guide Labs Steerling-8B: '설명 가능한 AI'를 오픈소스로, 왜 주목해야 하나

EU AI Act에 따르면 2026년 8월 2일부터 고위험 AI 시스템은 "의사결정 과정을 충분히 투명하게" 설명해야 합니다. 그런데 지금 우리가 쓰는 LLM 중에 "이 답변이 왜 나왔는지" 제대로 설명할 수 있는 모델이 몇 개나 될까요? 거의 없었습니다. 적어도...

#ai 투명성#Guide Labs#Steerling-8B

Llama 4 Scout vs Maverick 완전 분석: 오픈소스 LLM의 새 기준, 실무에서 바로 쓸 수 있나?

회사에서 사내 문서 검색 시스템을 만들고 있었습니다. Claude API를 쓰고 있었는데, 월 비용이 슬슬 부담되기 시작하더군요. "오픈소스 모델로 바꾸면 비용을 반 이하로 줄일 수 있지 않을까?" 하는 생각이 들었을 때, 마침 Meta가 Llama 4를 공개했습니다. AI 모델의...

#llama 4#Maverick#Meta AI

AI Tools & Review📖 19분

Memobase: ChatGPT·Claude 기억을 하나로 잇는 AI 유니버설 메모리, 써볼 만할까?

"AI 메모리 통합"이라는 말을 처음 들었을 때 저는 콧방귀를 꼈습니다. 아니, ChatGPT에도 메모리 있고 Claude에도 메모리 생겼는데, 굳이 또 뭘 끼워넣어야 하나? 그냥 마케팅용 래퍼 아닌가 싶었거든요. Photo by Zach M on Unsplash...

#AI 도구 리뷰#ai 메모리#ai 생산성

Meta AI 스마트 글래스에 얼굴 인식이 온다: AI가 당신을 알아보는 시대, 준비됐나?

지나가는 사람의 이름이 안경에 뜬다면 지난주 금요일 밤, 개발자 슬랙 채널에서 링크 하나가 돌았습니다. "메타, 스마트 글래스에 얼굴 인식 기능 추가 추진." 처음엔 또 떡밥이겠거니 했는데, TechCrunch와 MacRumors까지 보도하길래 기사를 꼼꼼히 읽어봤습니다. 읽고 나서...

#AI 얼굴 인식#facial recognition#name tag

Meta Manus 데스크톱: 내 PC 파일을 직접 다루는 AI 에이전트, 써볼 만할까?

"You are the commander; Manus is the executor." Manus 공식 블로그에 적힌 이 문장이 이 도구의 철학을 압축합니다. 근데 정말 그런지, 직접 써보기 전까진 알 수 없는 거잖아요. 출처: Manus 공식 블로그 | Manus My Computer...

#AI 에이전트#AI 자동화#manus ai

Qwen3.5 리뷰: 알리바바 오픈소스 AI를 로컬에서 직접 돌려봤다

오픈소스 LLM 경쟁이 뜨거워지고 있다. 왜 Qwen3.5를 찾게 됐나 저는 오픈소스 LLM에 대해 약간의 편견이 있었습니다. "클로즈드 모델 대비 한 두 세대 뒤처져 있다"는 인식이요. 그런데 지난주 Llama 4 Scout를 써보면서 그 생각이 많이 바뀌었습니다....

#AI리뷰#Ollama#Qwen3.5

relaxAI 리뷰: 프라이버시 우선 AI 어시스턴트, 영국 데이터 주권이란?

혹시 AI 챗봇에 회사 코드를 붙여넣으면서 "이 데이터, 어디로 가는 거지?" 싶었던 적 있으신가요? Photo by Tanya Barrow on Unsplash | 영국 데이터 주권을 상징하는 런던의 아이콘 TL;DR : relaxAI는 영국 클라우드 기업 Civo가 만든 프라이버시...

#ai어시스턴트#Civo#GDPR

Ryt Bank: 메뉴 대신 AI 챗봇으로 은행 업무, 말레이시아에서 시작된 금융 AI의 미래

은행 앱을 열었는데 메뉴가 없다면 어떨까요? 송금 버튼도, 잔액 조회 탭도, 설정 아이콘도 없는 은행 앱. 대신 텍스트 입력창 하나만 덩그러니 놓여 있습니다. "엄마한테 50만 원 보내줘"라고 치면 진짜로 송금이 되는 은행. 그게 말레이시아에서 실제로 돌아가고 있습니다. 출처:...

#AI 뱅킹#ILMU LLM#Ryt Bank

Seedance 2.0 리뷰: ByteDance의 AI 영상 생성이 헐리우드를 흔들다

왜 Seedance 2.0에 주목하게 됐나 저는 AI 영상 생성 도구에 대해 "아직은 장난감 수준"이라는 인식이 강했습니다. 작년에 Sora가 처음 공개됐을 때 흥분했다가, 실제로 써보니 5초짜리 클립에서 손가락이 6개가 되는 걸 보고 현실로 돌아왔거든요. 그런데 2월...

Sora 2 vs Google Veo 3.1: 2026 AI 영상 생성 양대 산맥, 어디가 더 나을까?

"프로젝트 소개 영상 하나만 있으면 되는데, 촬영팀 부르자니 200만 원이고, 스톡 영상 쓰자니 너무 뻔하고." 지난달 사이드 프로젝트 랜딩 페이지를 만들면서 딱 이 상황에 부딪혔습니다. 그래서 요즘 가장 핫하다는 AI 영상 생성 도구 두 개를 직접 비교해봤습니다. AI 영상 생성...

#AI 도구 비교#ai 비디오#ai 영상 생성

Windsurf 2026 업데이트 후기: Cursor 대안이 될 수 있을까?

Windsurf 2026 최신 버전을 2주간 실사용한 후기입니다. Cursor와 코드 자동완성, AI 채팅, 속도를 직접 비교하고 누구에게 추천하는지 정리했습니다. Cursor가 좋긴 한데, 한 가지 불만이 있었습니다 저는 Cursor를 작년 중반부터 메인 에디터로 쓰고 있었습니다....