AI 모델이 가장 진보된 수학을 해독하기 시작했습니다.

January 15, 2026

이번주말에는 닐 소마니프로그래머이자 전직 데이터 과학자이자 발명가인 그는 새로운 OpenAI 모델의 수학적 기능을 테스트하던 중 예상치 못한 발견을 했습니다. 문제를 ChatGPT에 넣고 15분 동안 생각하게 한 후 그는 완전한 솔루션으로 돌아왔습니다. 그는 증거를 분석하고 하모닉(Harmonic)이라는 도구로 제작했는데, 모두 확인됐다.

Somani는 “저는 LLM이 수학 문제를 풀 때 어려움을 겪는 부분과 비교하여 언제 해결할 수 있는지에 대한 기준을 설정하는 데 관심이 있었습니다.”라고 말했습니다. 놀라운 점은 새로운 모델을 사용하면서 한계가 조금 더 나아지기 시작했다는 것입니다.

ChatGPT 이미지 생각의 사슬 매우 흥미롭습니다. 수학적 공리처럼 들립니다. 르장드르의 공식, 베르트랑의 이론그리고 다윗의 별 정리. 드디어 모델이 발견되었습니다 2013년 Math Overflow 게시물하버드 수학자 노암 엘키스(Noam Elkies)는 비슷한 문제에 대한 훌륭한 해결책을 제시했습니다. 그러나 ChatGPT의 최종 증명은 중요한 면에서 Elkies의 작업과 달랐으며, 그는 해결되지 않은 문제가 AI의 증거였던 수학자 Paul Erdös에게 알려진 문제 유형에 대한 완전한 솔루션을 제공했습니다.

기계 지능을 의심하는 사람이라면 이는 놀라운 결과일 것입니다. 하지만 그게 전부는 아닙니다. AI 도구는 Harmonic의 Aristotle과 같은 표준 LLM부터 OpenAI의 심층 연구와 같은 문헌 검토 도구에 이르기까지 수학 분야 어디에나 존재하게 되었습니다. 그러나 Somani가 “이전보다 수학적 개념에 더 전문화되어 있다”고 설명하는 GPT 5.2가 출시된 이후로 해결된 문제의 수는 무시하기 어려워졌으며, 인간 지식의 한계를 뛰어넘는 대규모 모델의 능력에 대한 새로운 의문이 제기되었습니다.

소마니는 헝가리 수학자에 의해 창안된 1,000개 이상의 아이디어인 에르되시 문제를 살펴보고 있었습니다. 온라인에 저장됨. 이러한 문제는 AI 기반 수학 테스트의 대상이었으며 주제와 난이도가 매우 다양합니다. 독립적인 응답의 첫 번째 배치는 11월부터 시작되었습니다. AlphaEvolve라는 Gemini 모델 – 그러나 최근 Somani와 다른 사람들은 GPT 5.2가 고급 수학에 놀라울 정도로 뛰어나다는 사실을 발견했습니다.

크리스마스 이후 Erdös 웹사이트에서 15개의 문제가 “공개”에서 “해결”로 이동되었으며, 답변 중 11개는 프로젝트에 관련된 AI에 대해 언급했습니다.

존경받는 수학자 테렌스 타오(Terence Tao)는 개발 과정에 중점을 둡니다. GitHub 페이지에서AI 모델이 Erdös 문제와 별개로 진전을 이룬 8가지 사례와 이전 연구를 연구하고 확장하여 진전이 이루어진 6가지 사례를 살펴보겠습니다. 인간의 개입 없이 수학을 할 수 있는 AI 시스템과는 아직 거리가 멀지만, 대형 모델이 수행하는 중요한 역할이 있다는 것은 분명합니다.

테크크런치 이벤트

샌프란시스코
| |
2026년 10월 13~15일

마스토돈에서Tao는 AI 시스템의 복잡성으로 인해 AI 시스템이 “에르되스가 잘못 정의한 문제의 ‘롱테일’에 체계적으로 적용하는 데 적합하며, 그 중 다수는 간단한 해결책을 가지고 있다”고 추론했습니다.

Tao는 “따라서 이러한 단순한 Erdös 문제의 대부분은 이제 인간이나 하이브리드 방법이 아닌 AI 기반 방법으로 해결될 수 있습니다”라고 말했습니다.

수학적 추론을 더 쉽게 증명할 수 있게 해주는 또 다른 것은 최근의 확장입니다. 구현은 AI나 컴퓨터를 사용하는 것을 의미하지 않지만 새로운 자동화 도구로 인해 프로세스가 더 쉬워졌습니다. 2013년 Microsoft Research에서 개발된 오픈 소스 “증거 기반” Lean은 증거 기반 접근 방식으로 현장에서 널리 사용되었습니다. Harmonic의 Aristotle과 같은 AI 도구는 보다 지속 가능한 작업을 가능하게 할 것이라고 약속합니다.

Harmonic의 창립자인 Tudor Achim에게 Erdös의 문제에 대한 갑작스런 도약은 세계 최고의 수학자들이 이러한 도구를 진지하게 받아들이기 시작했다는 사실보다 덜 중요합니다. “수학과 컴퓨터 과학 교사들이 그것을 사용하고 있다는 것이 매우 걱정됩니다. [AI tools]Achim은 “이 사람들은 보호해야 할 평판이 있으므로 Aristotle을 사용하거나 ChatGPT를 사용한다고 말하는 것이 실제 증거입니다.”라고 말했습니다.

원천

RELATED ARTICLESMORE FROM AUTHOR

Eat App은 Swiggy 인수 및 파트너십을 통해 인도 레스토랑 예약 사업에 진출하고자 합니다.

SpaceX는 Starbase에서 크레인이 추락하기 전에 크레인을 제대로 검사하지 못했다고 OSHA는 말합니다.

Grok은 X 사용자가 ‘옷 노출’에서 실제 인물 사진을 만드는 것을 금지합니다.

LEAVE A REPLY Cancel reply

RELATED ARTICLES MORE FROM AUTHOR