jangwook.net

Kim Jangwook

Personal technical notes on AI agents, automation, developer tools, and the process of building software.

한국어 김장욱의 기술 블로그 English Kim Jangwook's Tech Blog 日本語 Kim Jangwookの個人技術ブログ简体中文 Kim Jangwook 的个人技术博客

Latest Notes

Recent writing by language

The root page stays intentionally small. Choose a language, then read the full archive and related posts there.

한국어

AI 에이전트, 자동화, 개발 도구, 소프트웨어 제작 과정을 한국어로 기록합니다.

Archive

2026년 7월 1일

로컬 LLM에 에이전트 8개를 동시에 붙였더니 — Ollama 동시성 처리량 실측

서브에이전트를 병렬로 돌리면 로컬 모델도 그만큼 빨라질 줄 알았다. 직접 재보니 기본 Ollama는 요청을 줄 세워 처리해서 8개를 붙여도 총 처리량이 그대로였다. OLLAMA_NUM_PARALLEL을 올렸을 때의 처리량 이득과 그 대가를 M1 16GB에서 실측했다.

2026년 7월 1일

LocalBusiness 구조화 데이터, JS로 넣어도 되지만 서버사이드가 더 확실한 이유

매장 검색 페이지의 LocalBusiness JSON-LD를 JS로 주입하면 원시 HTML엔 블록이 0개다. 서버사이드 출력과 직접 비교하고, Google 공식 견해와 순위 한계까지 정리했다.

2026년 6월 30일

로컬 추론 모델은 추론값을 하는가 — gemma4:12b로 thinking ON/OFF를 직접 잰 기록

gemma4:12b의 빈 응답을 패키징 버그로 단정했다가 사실은 추론(thinking) 모델이었음을 뒤늦게 알았다. 추론 ON/OFF로 13문제를 돌려보니 정답은 1개 더 맞혔지만 출력 토큰을 68배, 시간을 19배 더 썼다. 에이전트에서 추론을 언제 켜고 끌지 실측으로 정리한다.

English

Personal notes on AI agents, automation, developer tools, and building software.

Archive

Jul 1, 2026

I Pointed 8 Agents at One Local LLM — Measuring Ollama Concurrency Throughput

I fired 8 agents at one local model expecting a speedup. Default Ollama serializes requests, so eight at once matched one. I benchmarked OLLAMA_NUM_PARALLEL.

Jul 1, 2026

LocalBusiness Structured Data: JS Injection Works, but Server-Side Is Safer

Inject LocalBusiness JSON-LD with JavaScript and the raw HTML holds zero ld+json blocks. I compared it against server-side output, with Google's official stance and the ranking limits.

Jun 30, 2026