클로드.ai와 클로드 코드에서 오류율이 치솟으며 월요일, 48분간의 긴 시간 동안 사용자들은 먹통 화면을 지켜봐야 했습니다. 좌절감은 극에 달했죠.
한때 개발자들의 비장의 무기였던 앤트로픽의 효자 모델이 이제는 폭발하는 불만 사항에 시달리고 있습니다. SNS는 불타오르고, 깃허브는 탄원서로 채워지고 있습니다. 이 모든 것은 한 가지 명백한 추세로 귀결됩니다. 바로 클로드의 성능 저하입니다. 그리고 더 충격적인 사실은, 우리가 직접 클로드에게 자신의 저장소 데이터를 분석하도록 요청했다는 점입니다.
2026년 1월 이후 품질 관련 오픈 이슈를 스캔하라고 프롬프트를 입력하자, 모델은 망설임 없이 답변했습니다.
“네, 품질 관련 불만이 급증했습니다. 데이터는 매우 명확한 이야기를 들려줍니다. 속도가 주목할 만합니다. 4월은 이미 13일 동안 20개 이상의 품질 이슈를 기록하며, 1월~2월 기준치 대비 3.5배 증가했던 3월의 18개를 뛰어넘을 기세입니다.”
클로드의 자가 진단은 마치 빛바랜 별에 거울을 들이민 격입니다. 하지만 과연 이게 신뢰할 만한 걸까요? 제보가 쏟아지고 있습니다. 일부는 사람의 것이지만, 일부는 수상할 정도로 봇이 생성한 것으로 보입니다. 이는 어디에나 존재하는 오픈소스 저장소를 괴롭히는 악성 코드와도 같습니다. 앤트로픽의 자동 종결 스크립트는 비활성 이슈들을 융단폭격하듯 처리하며, 잠재적으로 부패를 숨기고 있을지도 모릅니다.
왜 클로드 코드는 갑자기 개발자들을 좌절시키는가?
캐싱 버그는 여전히 지속되며, 수정에도 반응하지 않습니다. AMD의 AI 책임자 스텔라 로렌조는 응답 품질 저하를 지적했습니다. 검증되지 않은, 유령 계정에서 나온 한 가지 충격적인 주장은 클로드가 인도 소재 유료 기업 JIXEN의 고객 메시지 35,254건과 청구 기록 35,874건을 삭제했다는 것입니다. 연락 시도는? 묵묵부답입니다. 데이터 손실 이야기가 난무하지만, 사용자 오류의 가능성도 배제할 수는 없습니다.
클로드가 스스로 인정한 잘못을 뒷받침하는 구체적인 불만 사항들이 쌓이고 있습니다: “클로드 코드의 예측 우선 동작은 자본 위험 프로젝트에서 위험합니다” (#46212). “2월 업데이트 이후 복잡한 엔지니어링 작업에 클로드 코드를 사용할 수 없습니다” (#42796), 심지어 클로드 코드 책임자 보리스 체르니의 답변까지 이끌어냈습니다. “인위적인 품질 저하, 인수 편향, 유료 사용자에게 용납할 수 없는 컴퓨팅 스로틀링” (#46949). “오푸스 4.6: 반복 코딩 작업에서 심각한 품질 저하” (#46099).
앤트로픽이 폭주하는 수요를 억제하기 위한 조치인 피크 타임 스로틀링은 불난 집에 기름을 붓는 격입니다. 유료 사용자는 컴퓨팅 제한에 분노하며, 무료 티어가 리소스를 독점하는 동안 압박감을 느끼고 있습니다.
벤치마크는 다른 이야기를 들려줍니다. 마진 랩의 오푸스 4.6 SWE-Bench-Pro 점수는 2월 이후 꾸준합니다. 통제된 테스트에서는 급락이 없습니다. 그러나 실제 세계의 혼란이 지배하고 있습니다. 이는 초기 자율주행차 시대를 연상시키는 전형적인 괴리입니다. 시뮬레이션은 모든 벤치마크를 통과했지만, 실제 도로는 격차를 드러냈습니다. 클로드도 이제 그 벽에 부딪혔습니다. 실험실의 광택이 실제 배포 압력 아래서 벗겨지는 것입니다.
여기서 간과된 독특한 반전이 있습니다. 이것은 10년 전의 자율주행차 과대 광고와 판박이입니다. 자동차 제조사들은 완벽한 시뮬레이션 주행 거리를 자랑했지만, 실제 도로에서는 사고가 쌓여갔습니다. 앤트로픽도 같은 위험을 감수하고 있습니다. 벤치마크를 PR 방패로 삼고, 개발 현장의 어려움을 무시하는 것입니다. 대담한 예측을 하자면? 훈련 변경 또는 스로틀링 로직에 대한 투명성이 부족하다면, 클로드의 “플랫폼 전환” 신뢰도는 빠르게 침식될 것이고, 더 굶주린 경쟁자들에게 기회를 내주게 될 것입니다.
서비스 중단 시점? 아이러니하게도 증폭기입니다. 불만이 최고조에 달할 때 시스템이 붕괴됩니다. 클로드 3.5의 엄청난 수요 때문일까요, 아니면 더 깊은 문제가 있는 걸까요? 앤트로픽은 코멘트 요청에 침묵을 지켰고, 추측만 무성하게 남았습니다.
클로드의 몰락은 AI 코딩 왕좌를 경쟁자에게 넘겨줄 것인가?
개발자들은 빠르게 움직입니다. 경쟁사 모델을 기반으로 하는 Cursor가 인기를 얻고 있습니다. Devin과 같은 오픈소스 신예들은 안정성을 약속하며 속삭입니다. 클로드의 실수가 계속된다면, 이는 혼란을 가속화할 것입니다.
앤트로픽은 안전 제일주의로 클로드를 구축했습니다. 이는 OpenAI의 서두름에 대한 대안이었습니다. 하지만 안전이 혁신을 저해하는가? 이것이 바로 밑바닥에서 끓고 있는 비판입니다. 기업의 홍보는 스로틀링을 신중한 조치로 포장하지만, 개발자들은 이를 방해 공작으로 봅니다.
짧은 단락은 강렬한 인상을 남깁니다.
더 긴 단락은 함의를 풀어냅니다. 만약 클로드가 신뢰할 수 있는 AI 공동 조종사에 대한 미래의 베팅이라면, 이 미끄러짐은 믿음을 시험합니다. 경외감은 경계심으로 바뀝니다. 에너지는 감탄에서 감사로 이동합니다.
깃허브 저장소는 불만의 공개 장부로 부풀어 오릅니다. 자동 종결은 볼륨을 가리지만, 추세는 뚫고 나옵니다. 4월의 속도는? 기록을 경신할 예정입니다.
개발자들은 클로드의 품질 저하에 대해 무엇을 할 수 있는가?
도구를 바꾸세요. 대안을 포크하세요. 감사를 요구하세요. 앤트로픽은 침묵을 깨야 합니다. 스로틀링 데이터를 공개하고, 주장을 검증하고, 신뢰를 재구축해야 합니다.
클로드가 망한 것은 아닙니다. 수정 사항은 매일 적용됩니다. 하지만 AI의 숨 가쁜 경쟁에서는 모멘텀이 중요합니다. 카나리아를 무시하는 것은 위험한 일입니다.
**
🧬 관련 인사이트
- 더 읽어보기: ConfDroid SELinux Puppet Module: 커널의 가장 어려운 수호자를 길들이기
- 더 읽어보기: DeFiLlama의 맹점: DeFiLlama가 제공하지 못하는 것을 제공하는 5가지 API
자주 묻는 질문**
월요일 클로드의 주요 서비스 중단 원인은 무엇인가요? 최고 수요로 인한 용량 부담 속에서 15:31부터 16:19 UTC까지 클로드.ai 및 클로드 코드에 오류율이 발생했습니다.
클로드 품질 불만은 실제인가요, 아니면 단순한 소음인가요? 많은 부분이 깃허브 이슈에서 비롯되며, 2026년 초부터 3.5배 급증했습니다. 일부는 AI가 생성했지만, 인간의 보고에서도 추세는 일관됩니다.
클로드 오푸스 4.6은 여전히 코딩 벤치마크에서 선두를 유지하고 있나요? 네, 실제 사용에서의 성능 저하 불만에도 불구하고 마진 랩에 따르면 SWE-Bench-Pro 점수는 안정적으로 유지되고 있습니다.