archive

ブログ

Ollama + FastAPIでローカルLLM APIサーバーを作る — 開発からDockerデプロイまで完全ガイド note
10 分

Ollama + FastAPIでローカルLLM APIサーバーを作る — 開発からDockerデプロイまで完全ガイド

Ollama REST APIをFastAPIでラッピングし、SSEストリーミング・ヘルスチェック・Docker Composeデプロイを備えたプロダクション用ローカルLLMサーバーを段階的に構築する実践ガイド。Llama 3.2やMistralなど複数モデルの実行ログとAPIテスト例も掲載しています。

#Ollama #FastAPI #ローカルLLM
続きを読む
MCPリモートHTTPサーバーデプロイパターン — stdioからStreamable HTTPへ移行するエージェント拡張ガイド note
9 分

MCPリモートHTTPサーバーデプロイパターン — stdioからStreamable HTTPへ移行するエージェント拡張ガイド

MCP Streamable HTTPトランスポートでstdioサーバーをリモート配備可能なHTTPサービスへ移行する実践ガイド。@modelcontextprotocol/sdk v1.29.0基準でstateful・statelessモードの実装とDocker・Cloudflare配備パターンを実験ログとともに解説します。

#MCP #TypeScript #AIエージェント
続きを読む
JestからVitest 4への完全移行ガイド — インストールから実践テストまで note
5 分

JestからVitest 4への完全移行ガイド — インストールから実践テストまで

Vitest 4.1.7ベースでJestプロジェクトをステップごとに移行する実践ガイド。インストールから設定切り替え・コード変換パターン・安定Browser Mode・新マッチャー(toSatisfy, toBeOneOf)まで、実際のサンドボックスで検証した全結果をまとめた決定版の完全移行ガイド。

#Vitest #Jest #TypeScript
続きを読む
Gemini API モデル選択ガイド 2026 — Flash-Liteから3.5 Flashまで直接測定した速度・コスト・品質のトレードオフ note
13 分

Gemini API モデル選択ガイド 2026 — Flash-Liteから3.5 Flashまで直接測定した速度・コスト・品質のトレードオフ

2026年5月の実測データ。Gemini 2.5 Flash-Lite(65 TPS)、2.5 Flash、2.5 Pro、3.5 Flashを同条件で比較。チャットボット・コードレビュー・RAGシナリオ別月次コスト計算と、どのプロジェクトにどのモデルを使うべきかの判断基準を整理する。

#Gemini #API #LLM
続きを読む
RTK(Rust Token Killer)を実際に試した — LLMトークンコストを60〜90%削減するCLIプロキシ note
10 分

RTK(Rust Token Killer)を実際に試した — LLMトークンコストを60〜90%削減するCLIプロキシ

RTK(Rust Token Killer)はAIコーディングエージェントのBashコマンド出力をLLMに送信する前に圧縮するCLIプロキシだ。実際にインストールし、findで90%、lsで50%のトークン削減を確認した。効果がある場合とない場合、Claude Code統合方法、正直な限界まで整理する。

#llm-cost #claude-code #developer-tools
続きを読む
Claude Agent SDK サブエージェント・オーケストレーション実践ガイド — マルチエージェント並列処理を完全制覇 note
6 分

Claude Agent SDK サブエージェント・オーケストレーション実践ガイド — マルチエージェント並列処理を完全制覇

claude-agent-sdk 0.2.82を実際にインストールしてAgentDefinition構造とサブエージェント並列実行パターンを検証した。オーケストレーターが3つのサブエージェントを同時にスポーンし、TaskBudgetでコストを制御する全体フローをPythonコードとともに詳しく解説する。

#Claude #Anthropic SDK #Subagents
続きを読む
Cloudflare Agents Week 2026分析 — AIエージェントがクラウドインフラを自律的にプロビジョニングする note
11 分

Cloudflare Agents Week 2026分析 — AIエージェントがクラウドインフラを自律的にプロビジョニングする

Cloudflareが4月のAgents Week行事で20件以上の発表を行った。Sandboxes GA、Artifacts、Dynamic Workers、さらにエージェントが直接Cloudflareアカウントを作成してドメインを購入する機能まで。@cloudflare/agents SDKをローカルで実際に動かした結果をまとめた。

#Cloudflare #AIエージェント #エージェントインフラ
続きを読む
AWS MCP Server GA 実践ガイド — CloudWatch·IAMでAIエージェントにAWSを理解させる note
8 分

AWS MCP Server GA 実践ガイド — CloudWatch·IAMでAIエージェントにAWSを理解させる

AWS MCPサーバーが2026年5月に正式リリース。uvx 1行でCloudWatch 31ツールとIAM 29ツールをClaude Codeに接続した実践レポート。IAM条件キー(aws:ViaAWSMCPService)基盤のエージェント権限分離アーキテクチャ分析と実際のAWSアカウント連携テスト結果・率直な評価まで。

#AWS #MCP #CloudWatch
続きを読む
Claude Agent SDK 実践ガイド — Tool UseでAIエージェントが実際に行動するようにする方法 note
7 分

Claude Agent SDK 実践ガイド — Tool UseでAIエージェントが実際に行動するようにする方法

anthropic 0.101.0 SDKを直接インストールしてtool_useエージェンティックループを実装した。JSONスキーマツール定義から複数ツール呼び出し、エラーハンドリング、ストリーミング、コスト最適化まで — チャットボットとエージェントを分けるコアパターンを段階的な実践コードで解説する。

#Claude #Anthropic SDK #Tool Use
続きを読む
FastAPI + Claude API ストリーミングバックエンド — SSE・リトライ・エラー復旧 実践ガイド note
9 分

FastAPI + Claude API ストリーミングバックエンド — SSE・リトライ・エラー復旧 実践ガイド

FastAPIとAnthropic SDKでプロダクションレベルのストリーミングAIバックエンドを構築する完全ガイド。SSEストリーミングエンドポイント実装、レートリミット指数バックオフリトライ、エラー分類戦略、トークンストリーミング最適化、Dockerコンテナデプロイをステップごとにコード例付きで解説します。

#FastAPI #Claude API #Python
続きを読む
Claude Code 実践マスタークラス #1 — コマンド・フック・サブエージェント3ステップ自動化 note
9 分

Claude Code 実践マスタークラス #1 — コマンド・フック・サブエージェント3ステップ自動化

スラッシュコマンド(.claude/commands/)でタスクを定義し、settings.jsonフックでイベントに連結し、サブエージェント(.claude/agents/)に委任する3ステップのClaude Code自動化パターンを実際のブログ自動化システム構築事例でコード例を交えて解説します。

#ClaudeCode #自動化 #サブエージェント
続きを読む
Google ADK vs LangGraph 2026: 両方を実際にインストールして比較してみた note
9 分

Google ADK vs LangGraph 2026: 両方を実際にインストールして比較してみた

Google ADK v1.32.0とLangGraph v1.1.10をサンドボックスで直接インストールし、コード構造、依存パッケージ数、状態管理の実装、条件分岐のアーキテクチャ、デプロイCLIの違いを実験で比較しました。どのユースケースにどちらが適しているかを実測データで明確に解説します。

#google-adk #langgraph #ai-agent
続きを読む
Anthropicの4月二大リリース — Opus 4.7とManaged Agentsがエージェント開発を変える方法 note
10 分

Anthropicの4月二大リリース — Opus 4.7とManaged Agentsがエージェント開発を変える方法

Claude Opus 4.7(4月16日)とManaged Agentsベータ(4月8日)が同じ月に登場。ベンチマークは過去最高なのにコミュニティ反応が割れている。新トークナイザーのコスト衝撃、task_budget、セッションあたり$0.08モデルの実際の意味を分析する。

#Claude #AIエージェント #Anthropic
続きを読む
Claude APIプロンプトキャッシング実践 — LLMコストを70%削減する4パターン note
8 分

Claude APIプロンプトキャッシング実践 — LLMコストを70%削減する4パターン

実際のプロダクション環境でClaude APIプロンプトキャッシングを適用した経験ベースの完全ガイドです。システムプロンプト・RAGドキュメント・ ツール定義・マルチターン会話の4パターン、2026年TTL変更の落とし穴、コスト削減の計測方法を実測データと共に解説します。

#claude-api #cost-optimization #prompt-caching
続きを読む
AIエージェントフレームワーク比較2026: LangGraph vs CrewAI vs Dapr 選択基準 note
10 分

AIエージェントフレームワーク比較2026: LangGraph vs CrewAI vs Dapr 選択基準

LangGraph v1.0、CrewAI v1.10、Dapr Agents v1.0をプロダクション基準で比較します。アーキテクチャ、開発速度、 運用耐久性、コストを分析し、状態管理型・協調型・インフラ統合型それぞれでチームに最適なマルチエージェントフレームワークを選ぶ基準を提示します。

#ai-agent #langgraph #crewai
続きを読む
AnthropicがClaudeをこっそり低下させた論争 — パワーユーザー反発の本当の文脈 note
19 分

AnthropicがClaudeをこっそり低下させた論争 — パワーユーザー反発の本当の文脈

2026年3月、AnthropicがClaudeのデフォルトeffortレベルを静かに"medium"に引き下げた。パワーユーザーの反発と価格引き上げ論争、 そしてこの問題が明らかにしたAIサービスの透明性と信頼危機をCTO・エンジニアリングリーダー視点で分析する。

#anthropic #claude #ai-performance
続きを読む
Claude Codeのエージェントワークフローパターン5選 — 自分の作業に合うパターンは? note
7 分

Claude Codeのエージェントワークフローパターン5選 — 自分の作業に合うパターンは?

Claude Codeのエージェントワークフローパターン5選 — 順次・オペレーター・並列・チーム・自律を実際に使いながら比較整理しました。各パターンの動作原理、適した作業タイプ、コスト・速度のトレードオフ、そして選択基準を実践経験に基づいて解説します。

#ClaudeCode #エージェントAI #ワークフロー
続きを読む
Paperclip — AIエージェントを社員のように管理するオープンソースプラットフォームをインストールしてみた note
8 分

Paperclip — AIエージェントを社員のように管理するオープンソースプラットフォームをインストールしてみた

AIエージェントを社員として管理するオープンソースプラットフォームPaperclipを実際にインストールした。Linearスタイルのダッシュボード、Org Chart、コスト追跡、多様なエージェントアダプターまで — Claude Codeエージェントを組織化する実体験と率直な評価。

#ai-agents #open-source #orchestration
続きを読む
AIコーディングエージェントが2,900万件のシークレットを漏洩させた — MCP設定ファイルセキュリティの盲点 note
7 分

AIコーディングエージェントが2,900万件のシークレットを漏洩させた — MCP設定ファイルセキュリティの盲点

GitGuardian 2026レポートによると、AIコーディングツールを使用するリポジトリのシークレット漏洩率はGitHub平均の2倍です。MCP設定ファイルだけで24,000件以上のクレデンシャルが露出しました。実際の点検方法と対策をまとめます。

#security #mcp #ai-coding
続きを読む
Mistral Voxtral TTS — 3秒ボイスクローニング+オープンウェイト、しかし日本語非対応 note
7 分

Mistral Voxtral TTS — 3秒ボイスクローニング+オープンウェイト、しかし日本語非対応

Mistralが公開した4BパラメータオープンウェイトTTSモデルVoxtralを分析する。3秒ボイスクローニング機能を備え人間評価でElevenLabsを超えた実力を持ちながら、日本語・韓国語非対応という致命的な弱点がアジア市場での利用を阻む。CC BY NCライセンスの注意点と代替案も解説する。

#ai #tts #open-source
続きを読む
Claude Code Channelsでテレグラムからコーディングを指示する — OpenClawユーザーから見た率直な比較 note
8 分

Claude Code Channelsでテレグラムからコーディングを指示する — OpenClawユーザーから見た率直な比較

Claude CodeにChannels機能が追加されました。テレグラムからメッセージを送ると、ローカルターミナルのClaudeがコードを実行して返信してくれます。OpenClawのチャネル概念を取り入れつつも、セキュリティモデルを全く異なる設計にした点が興味深いです。

#claude-code #ai-agents #automation
続きを読む
Morgan Stanleyが警告した2026年AI飛躍 — CTOが今準備すべき5つの戦略 note
8 分

Morgan Stanleyが警告した2026年AI飛躍 — CTOが今準備すべき5つの戦略

Morgan Stanleyが警告した2026年上半期のAI能力の非線形飛躍に備え、AIロードマップの四半期再設計、Centaur Podチーム構造、ハイブリッドインフラコスト、ガバナンスフレームワーク、AIリテラシーまで、CTOとエンジニアリングリーダーが今すぐ実行すべき5つの準備戦略を整理します。

#ai-strategy #engineering-leadership #cto
続きを読む
エージェントウォッシング見抜き術: EMのための7つのチェックリスト note
9 分

エージェントウォッシング見抜き術: EMのための7つのチェックリスト

数千のAIエージェントベンダーのうち本物は130社のみ。Engineering Managerが真のエージェントAIと単なる自動化を見分ける実践チェックリスト7選。目標再設定・コンテキスト記憶・ツール柔軟性・失敗復旧・予算認識・ドメイン一般化・推論の透明性を検証する7つのテストとベンダー評価の質問リスト付き。

#AIエージェント #EngineeringManager #ベンダー評価
続きを読む
Deloitte Tech Trends 2026が示唆するエージェンティック AI運用戦略 — 89%がプロダクションに到達できない理由と、EMのための Delegate、Review、Own フレームワーク note
15 分

Deloitte Tech Trends 2026が示唆するエージェンティック AI運用戦略 — 89%がプロダクションに到達できない理由と、EMのための Delegate、Review、Own フレームワーク

Deloitte Tech Trends 2026が明かす衝撃—11%しか本番Agentic AIを運用していない現実。89%が停滞する 根本原因は技術ではなく運用モデル。月曜朝から即実行できるDelegate・Review・OwnフレームワークのEM・VPoEガイドです。

#ai-agent #engineering-management #enterprise
続きを読む
Claude Code Agent Teams 完全ガイド — 5チーム構成と実践運用 note
10 分

Claude Code Agent Teams 完全ガイド — 5チーム構成と実践運用

Claude CodeのAgent TeamsをOpenClaw環境で有効化する全手順と、5専門チームの構成方法を丁寧に解説します。アーキテクチャ・コーディング・テスト・セキュリティ・DevOpsエージェントをオーケストレーターパターンで連携させ、プロダクション級アプリを自動構築した実践知見を共有します。

#claude-code #agent-teams #openclaw
続きを読む
AIエージェントに性別とペルソナを付与すると何が起こるのか? note
8 分

AIエージェントに性別とペルソナを付与すると何が起こるのか?

AIエージェントに性別やペルソナを付与すると実際に業務パフォーマンスが変わるのか?120件以上の心理学・NLP研究をもとに、 専門家ペルソナ・感情表現・役割付与の実証効果を整理し、コーディング・創作・要約などタスク別の最適エージェント設計戦略を解説します。

#AI Agent #Persona #Research
続きを読む