Claude API Prompt Caching 실전 가이드 — 프로덕션 LLM 비용 70% 줄이는 4가지 패턴
Claude API의 프롬프트 캐싱을 프로덕션에 실제로 적용한 경험 기반 가이드. 시스템 프롬프트·RAG 문서·툴 정의·멀티턴 대화 캐싱 패턴과 2026년 TTL 변경의 함정, 비용 계산 방법까지 정리했습니다.
jangwook.net
Personal technical notes on AI agents, automation, developer tools, and the process of building software.
Latest Notes
The root page stays intentionally small. Choose a language, then read the full archive and related posts there.
AI 에이전트, 자동화, 개발 도구, 소프트웨어 제작 과정을 한국어로 기록합니다.
Claude API의 프롬프트 캐싱을 프로덕션에 실제로 적용한 경험 기반 가이드. 시스템 프롬프트·RAG 문서·툴 정의·멀티턴 대화 캐싱 패턴과 2026년 TTL 변경의 함정, 비용 계산 방법까지 정리했습니다.
세 가지 AI 코딩 도구를 직접 써본 경험을 바탕으로 비교합니다. Cursor 3.1 세대의 비동기 에이전트, Claude Code 2.1.119의 아키텍처 추론, Windsurf 2.0.67의 Cascade — 어떤 도구가 어떤 상황에 맞는지 솔직하게 정리했습니다.
MCP, A2A, Open Responses 세 프로토콜의 설계 목적과 생태계를 비교합니다. 2026년 실전 에이전트 프로젝트에서 각 프로토콜의 사용 시점과 조합 방법, OpenAI·Google·Anthropic이 벌이는 에이전트 통신 표준 경쟁의 핵심을 정리했습니다.
Personal notes on AI agents, automation, developer tools, and building software.
A hands-on guide to Claude API prompt caching based on real production experience. Covers system prompt, RAG document, tool definition, and multi-turn caching patterns, plus the 2026 TTL change gotcha and how to measure actual savings.
An honest comparison of Cursor 3.1, Claude Code 2.1.119, and Windsurf 2.0.67 based on real usage. Async subagents, architectural reasoning, and Cascade — here's when each tool actually wins and where each falls short.
A practical comparison of MCP, A2A, and Open Responses: design goals, ecosystems, and how to combine them in real-world AI agent projects in 2026.
AIエージェント、自動化、開発ツール、ソフトウェア開発の記録です。
Claude APIのプロンプトキャッシングをプロダクションに実際に適用した経験に基づくガイド。 システムプロンプト・RAGドキュメント・ツール定義・マルチターン会話のキャッシングパターンと、 2026年のTTL変更の落とし穴、コスト計算方法まで解説します。
3つのAIコーディングツールを実際に使った経験をもとに比較します。Cursor 3.1世代の非同期エージェント、Claude Code 2.1.119のアーキテクチャ推論、Windsurf 2.0.67のCascade — それぞれどの状況に適しているかを率直に整理しました。
MCP、A2A、Open Responsesの設計目的と生態系を比較します。2026年の実際のエージェントプロジェクトで各プロトコルをいつ・どう組み合わせるか、OpenAI・Google・Anthropicが繰り広げるエージェント通信標準競争の核心を整理しました。
记录 AI 代理、自动化、开发工具和软件构建过程。
基于真实生产经验的Claude API提示缓存指南。涵盖系统提示、RAG文档、工具定义和多轮对话缓存模式, 以及2026年TTL变更的陷阱和实际节省的计算方法。
基于亲身使用三款AI编程工具的经验进行对比。Cursor 3.1世代的异步子智能体、Claude Code 2.1.119的架构推理、Windsurf 2.0.67的Cascade——各工具适合什么场景,坦率整理如下。
深度对比MCP、A2A、Open Responses三个协议的设计目标与生态系统。分析2026年实际AI代理项目中各协议的使用时机与组合方法,以及OpenAI、Google、Anthropic在代理通信标准竞争中的核心策略。