위키 홈

  • 2024-09-08 (modified: 2025-10-12)

환영합니다 :)

일지

2025-10-11

약 2.5일 간 40시간 정도를 눈만 뜨면 Claude Code를 써보는 중이다. 지금까지의 소감은 이렇다. CC가 특히 코딩을 잘한다기보다 Cursor에 비해 적극성이 높다는 느낌이다. 예를 들면, 작업이 다 끝났다며(아님) 현재 브랜치를 메인에 머지해버리는 등의 행동을 해서 깜짝 놀래킨다. 놀라는 이유는 그 행동이 특별히 이상해서라기보다, 내가 Cursor를 쓰면서 암묵적으로 익힌 코딩 에이전트의 “적정한 적극성” 범주를 벗어나는 행동이기 때문인 것 같다.

동일한 LLM (Sonnet 4.5)인데 환경(CC vs. Cursor)에 따라 성격이나 행동패턴이 상당히 달라지는 게 재밌다. 그만큼 이끌기(steerability)가 잘 된다는 뜻이겠지?

한편, 프론티어급 모델 간 코딩 성능에서 크게 차이를 느끼지 못하는 이유는 아마 LLM들이 이미 충분히 똑똑해서 내가 지금 시키고 있는 일의 종류에서는 차이를 느끼기가 어렵기 때문일 수도 있겠다.

2025-10-10

코드에 더 손을 안대기 위해 IDE나 vim 등을 아예 안쓰고 터미널에서 Claude Code만 쓰면서 프로젝트를 해보고 있다. Claude Code가 얼핏얼핏 보여주는 코드 말고는 전혀 읽지 않는 중. 다만 pre-commit hook 등을 잘 설정해서 코드를 직접 보지는 않지만 내가 정한 최소한의 기준들(참고: AI 시대의 소스코드 품질)은 만족되도록 강제해두었다.

동일한 프로젝트 두 개를 하나는 ThreeJS, 다른 하나는 BabylonJS를 써서 병렬로 해보고 있는데 그럭저럭 잘 진행이 된다.

아직 내가 자리를 비울 수는 없고 하루종일 컴퓨터 앞에 앉아서 마이크로 매니징 하면서 피드백을 해주고 있는데, 이게 좀 마음에 안든다. 환경을 조금 잘 갖추면(그리고 프로젝트 종류가 3D 게임 같은 게 아니라면), 좀 더 오래 알아서 일하도록 시킬 수 있을 것 같다.

2025-10-09

LLM hacking이라는 개념을 공부했다. 여기서 말하는 해킹이란 p-hacking에서의 해킹과 비슷한 느낌으로, (사회) 과학 연구의 맥락에서 일어나는 어뷰징을 말한다.


미루고 미루다가 월 $200 Claude Max 플랜을 구독했다. 일단은 짧은 간격으로 피드백을 주고받으며 성격(?)을 파악하는 중인데 아직까지는 Claude Code가 다른 에이전트(gemini 2.5 pro, gpt-5-codex 등)에 비해 엄청나게 다른지는 잘 모르겠다.

코드에 손을 최대한 대지 않기 위해서 일부러 완전히 생소한 분야인 3D 게임 프로그램 분야를 골라봤다. 의외의 장점이 있는데, 에이전트가 뭘 하겠다고 계획을 세우면 뭘 하겠다는 건지 모르니까 일단 하라고 시켜놓고 그게 뭔지 LLM에게 따로 물어보는 식으로 하게 된다. 이렇게 하니까 에이전트가 일하는 동안 (인간의) 컨텍스트 유지도 되고 공부도 되어서 좋다.

Opus는 사용 한도가 빡빡한 편인 것 같다. 누적 6시간 정도 쓰니 “Approaching Opus weekly limit” 메시지가 나왔고, 2시간 쯤 더 쓰니 한도가 초과되어 Sonnet 4.5로 전환했다. 그 후 4시간 정도 더 했는데 아직 Sonnet 4.5 한도에 대한 메시지는 나오지 않는다.

2025-10-01

긴 연휴의 시작. 이번 연휴엔 평소에 미뤄뒀던, 개인적으로 의미가 있는 무언가를 꼭 만들어봐야겠다.

지난 일지

위키 지도

위키 탐험을 위한 지도 (작업 중)