Cursor 3.3 완전 정리: /multitask 서브에이전트·Bugbot 자가학습·취약점 스캐너 [2026-05]
Cursor 3.3 (5월 7일) 새 기능 정리: /multitask 비동기 서브에이전트, Bugbot 자가학습, 취약점 스캐너를 실사용 관점에서 분석합니다.
전체 글 (42)
Cursor 3.3 (5월 7일) 새 기능 정리: /multitask 비동기 서브에이전트, Bugbot 자가학습, 취약점 스캐너를 실사용 관점에서 분석합니다.
Xiaomi MiMo-V2.5-Pro가 SWE-bench 57.2%로 Claude Opus 4.6을 앞섰습니다. $1/M 오픈소스 1T LLM 완전 정리.
2026년 5월 Windsurf Devin Review 개방. SWE-check 무료·GPT-5.5 심층 차이, 가이드.
Claude Code v2.1.132 5월 업데이트 총정리. MCP 10GB 메모리 누수 수정·--plugin-url·Ctrl+R 전체 검색 등 핵심 변경사항 한눈에 정리했습니다.
Code w/ Claude 2026 발표: 에이전트가 이전 세션을 복기하는 Dreaming, 성공 루브릭 Outcomes, 멀티 에이전트 병렬 실행까지 정리했습니다.
ChatGPT 기본 모델이 GPT-5.5 Instant로 바뀌었습니다. 환각 52.5% 감소·AIME 81.2점·메모리 소스 공개까지, 달라진 것을 정리했습니다.
Mistral Medium 3.5가 5월 2일 출시됐습니다. 128B 오픈웨이트로 SWE-bench 77.6%, Vibe 클라우드 에이전트로 비동기 코딩 자동화까지. Claude Code와 무엇이 다른지 비교 정리했습니다.
Anthropic이 Opus 위에 새 티어를 만들었습니다. Claude Mythos Preview는 SWE-bench 93.9%, 제로데이 취약점 수천 개 자동 발견 — 하지만 일반 API 접근은 막혀 있습니다. Project Glasswing과 함께 왜 이 모델이 조용히 나왔는지, 무엇이 달라졌는지 정리했습니다.
DeepSeek이 V4-Pro와 V4-Flash를 동시 출시했습니다. LiveCodeBench 코딩 1위(93.5), MIT 오픈웨이트, 1M 컨텍스트 듀얼 모드 — GPT-5.5 대비 최대 107배 저렴한 가격과 V3.2 마이그레이션 가이드를 정리했습니다.
GitHub가 4월 20일 Copilot 개인 플랜을 전면 개편했습니다. 신규 가입 중단, Pro 모델 제한, Autopilot 출시까지 — Pro($10)와 Pro+($39) 중 어떤 선택이 맞는지 정리했습니다.
Gemini CLI v0.38.1에서 서브에이전트 공개 출시. @codebase_investigator 등 기본 에이전트, 병렬 실행, 커스텀 .md 정의까지 — 챕터, 컨텍스트 압축, 터미널 버퍼 등 4월 업데이트 전부 정리했습니다.
2026년 4월 1일부터 Gemini Pro 계열이 무료 티어에서 완전 제거됐습니다. Flash만 무료, 신규 계정은 선불 결제 기본. 변경 내용 전체 정리와 개발자 대응 전략 3가지를 담았습니다.
모두가 1.2조 파라미터 괴물을 기다렸다. DeepSeek은 32B 밀집 모델을 내놨고, AIME 2025에서 92.7%를 찍었다.
Meta Superintelligence Labs가 만든 Muse Spark, 5개 플랫폼 동시 탑재. $140억 투자 + MTIA 칩까지, Meta의 AI 판 어떻게 바뀌나.
Google이 Apache 2.0 라이선스로 Gemma 4를 공개했습니다. 에이전트 워크플로우 전용 설계, Gemini Nano 4의 기반 모델, 6x KV 캐시 압축까지 — 실무 적용 전 알아야 할 것들.
GitHub Copilot Cloud Agent가 4월에 대거 업데이트됐습니다. 리서치 모드, 플랜 모드, 커밋 서명, 에이전트 방화벽까지 — 핵심 5가지를 개발자 관점에서 정리합니다.
OpenAI Codex CLI의 최신 업데이트를 정리합니다. Windows 샌드박스 네트워킹, ChatGPT 디바이스 로그인, GPT-5.3-Codex-Spark 초당 1000토큰까지 개발자 관점에서 분석합니다.
좋아하는 J-Pop YouTube URL만 입력하면 AI가 가사를 분석하고 단어를 추출해서 SRS 플래시카드를 자동 생성합니다. YOASOBI, Ado, 요네즈 켄시 노래로 일본어 어휘를 재미있게 익히는 방법을 소개합니다.
Google Lyria 3 Pro는 3분짜리 풀 트랙을 생성하는 AI 음악 모델입니다. 구조 인식 작곡, 이미지-투-뮤직, SynthID 워터마크, API 가격까지 Suno/Udio와 비교 분석합니다.
혹시 사이드 프로젝트 랜딩 페이지에 넣을 이미지 하나 만들려고 Midjourney, DALL-E, Firefly를 번갈아 열어본 적 있으신가요? 저는 있습니다. 꽤 자주요. Photo by Glenn Carstens-Peters on Unsplash | AI 크리에이티브 도구로...
시작은 ChatGPT였다 작년 11월부터 본격적으로 AI 도구들을 써보기 시작했어요. 사실 처음엔 ChatGPT만 쓸 생각이었거든요. 근데 주변에서 Claude도 좋다더라, Gemini는 구글이라 검색이 강하다더라, Copilot은 무료라더라... 이런 얘기들 듣다 보니까 "아 그냥...
Suno v5 Studio와 Udio 2026을 직접 써보고 비교했습니다. 음질, 보컬, 조작성, 가격까지 AI 음악 생성기 완벽 비교 가이드 왜 AI 음악 생성기를 찾게 됐나 저는 음악에 대해 아는 게 거의 없습니다. 코드 진행이 뭔지, 믹싱이 뭔지도 잘 모르는...
Amazon One Medical의 수석 부사장 Nworah Ayogu는 최근 공식 블로그에서 이렇게 말했습니다. "우리는 Health AI가 단순 챗봇이 아니라, 환자와 의료진 사이의 다리가 되길 원합니다." 처음 이 말을 봤을 때는 또 빅테크의 포장이겠거니 했습니다. 근데...
"시리야, 지난주에 에릭이 보낸 아이스 스케이팅 관련 이메일 찾아줘." 이 한 문장이 실제로 작동하는 세상이 온다고 합니다. 올해 안에요. 저는 Siri에 대한 기대를 오래전에 접은 사람입니다. "시리야, 타이머 3분"이 Siri와의 대화에서 가장 복잡한 요청이었으니까요....
Cerebras WSE-3 핵심 스펙: 트랜지스터 4조 개, AI 코어 90만 개, 메모리 대역폭 21PB/s. 4월 IPO 일정, NVIDIA 비교, 투자 리스크까지 한눈에 정리.
2026년 2월 5일, AI 업계에 전례 없는 일이 벌어졌습니다. Anthropic이 Claude Opus 4.6을 공개한 지 불과 20분 만에 OpenAI가 GPT-5.3 Codex로 맞불을 놨습니다. 의도된 타이밍인지, 우연의 일치인지는 모르겠지만 — 확실한 건 2026년 AI...
Cursor가 자체 AI 모델을 만든다는 소식을 처음 들었을 때 "무모하다"고 생각했습니다. Anthropic과 OpenAI라는 거인의 어깨 위에서 편하게 수익을 올리던 회사가, 왜 굳이 수천억 원짜리 모델 훈련에 뛰어드는 걸까요. 근데 3월 19일...
Google이 Search Live를 200개국으로 확대하고 Gemini 3.1 Flash Live 모델을 탑재했습니다. 90개 언어 지원, 카메라 실시간 검색, SynthID 워터마크까지 개발자 관점에서 분석합니다.
"에이전트 만들어서 공유해봐." 팀 리드가 슬랙에 던진 한마디에 저는 Google Workspace Studio를 처음 열어봤습니다. "또 구글이 뭘 만들었나" 정도의 시큰둥한 기대였는데, 30분 만에 생각이 바뀌었습니다. 코드 한 줄 없이 Gmail에서 특정 패턴의...
GPT-5.2는 40만 토큰 컨텍스트 윈도우로 긴 문서 처리 능력이 확실히 한 단계 올라갔지만, 가격이 40% 인상됐고 실사용에서는 20만 토큰 이후 정확도가 떨어지는 구간이 존재합니다. 결론부터 말씀드리면, "쓸만하지만 만능은 아니다"입니다. GPT-5.2의 40만 토큰 컨텍스트는...
OpenAI의 공식 발표에 따르면, GPT-5.4의 개별 주장(claim)이 거짓일 확률은 GPT-5.2 대비 33% 감소했고, 전체 응답에 오류가 포함될 확률은 18% 낮아졌습니다 (2026년 3월 5일 기준, OpenAI 공식 블로그 ). 숫자만 보면 꽤 인상적입니다. 근데...
EU AI Act에 따르면 2026년 8월 2일부터 고위험 AI 시스템은 "의사결정 과정을 충분히 투명하게" 설명해야 합니다. 그런데 지금 우리가 쓰는 LLM 중에 "이 답변이 왜 나왔는지" 제대로 설명할 수 있는 모델이 몇 개나 될까요? 거의 없었습니다. 적어도...
회사에서 사내 문서 검색 시스템을 만들고 있었습니다. Claude API를 쓰고 있었는데, 월 비용이 슬슬 부담되기 시작하더군요. "오픈소스 모델로 바꾸면 비용을 반 이하로 줄일 수 있지 않을까?" 하는 생각이 들었을 때, 마침 Meta가 Llama 4를 공개했습니다. AI 모델의...
"AI 메모리 통합"이라는 말을 처음 들었을 때 저는 콧방귀를 꼈습니다. 아니, ChatGPT에도 메모리 있고 Claude에도 메모리 생겼는데, 굳이 또 뭘 끼워넣어야 하나? 그냥 마케팅용 래퍼 아닌가 싶었거든요. Photo by Zach M on Unsplash...
지나가는 사람의 이름이 안경에 뜬다면 지난주 금요일 밤, 개발자 슬랙 채널에서 링크 하나가 돌았습니다. "메타, 스마트 글래스에 얼굴 인식 기능 추가 추진." 처음엔 또 떡밥이겠거니 했는데, TechCrunch와 MacRumors까지 보도하길래 기사를 꼼꼼히 읽어봤습니다. 읽고 나서...
"You are the commander; Manus is the executor." Manus 공식 블로그에 적힌 이 문장이 이 도구의 철학을 압축합니다. 근데 정말 그런지, 직접 써보기 전까진 알 수 없는 거잖아요. 출처: Manus 공식 블로그 | Manus My Computer...
오픈소스 LLM 경쟁이 뜨거워지고 있다. 왜 Qwen3.5를 찾게 됐나 저는 오픈소스 LLM에 대해 약간의 편견이 있었습니다. "클로즈드 모델 대비 한 두 세대 뒤처져 있다"는 인식이요. 그런데 지난주 Llama 4 Scout를 써보면서 그 생각이 많이 바뀌었습니다....
혹시 AI 챗봇에 회사 코드를 붙여넣으면서 "이 데이터, 어디로 가는 거지?" 싶었던 적 있으신가요? Photo by Tanya Barrow on Unsplash | 영국 데이터 주권을 상징하는 런던의 아이콘 TL;DR : relaxAI는 영국 클라우드 기업 Civo가 만든 프라이버시...
은행 앱을 열었는데 메뉴가 없다면 어떨까요? 송금 버튼도, 잔액 조회 탭도, 설정 아이콘도 없는 은행 앱. 대신 텍스트 입력창 하나만 덩그러니 놓여 있습니다. "엄마한테 50만 원 보내줘"라고 치면 진짜로 송금이 되는 은행. 그게 말레이시아에서 실제로 돌아가고 있습니다. 출처:...
왜 Seedance 2.0에 주목하게 됐나 저는 AI 영상 생성 도구에 대해 "아직은 장난감 수준"이라는 인식이 강했습니다. 작년에 Sora가 처음 공개됐을 때 흥분했다가, 실제로 써보니 5초짜리 클립에서 손가락이 6개가 되는 걸 보고 현실로 돌아왔거든요. 그런데 2월...
"프로젝트 소개 영상 하나만 있으면 되는데, 촬영팀 부르자니 200만 원이고, 스톡 영상 쓰자니 너무 뻔하고." 지난달 사이드 프로젝트 랜딩 페이지를 만들면서 딱 이 상황에 부딪혔습니다. 그래서 요즘 가장 핫하다는 AI 영상 생성 도구 두 개를 직접 비교해봤습니다. AI 영상 생성...
Windsurf 2026 최신 버전을 2주간 실사용한 후기입니다. Cursor와 코드 자동완성, AI 채팅, 속도를 직접 비교하고 누구에게 추천하는지 정리했습니다. Cursor가 좋긴 한데, 한 가지 불만이 있었습니다 저는 Cursor를 작년 중반부터 메인 에디터로 쓰고 있었습니다....