Home 기술 Google의 Koray Kavukcuoglu: AI 사고를 사용하기 쉬운 제품으로 전환

Google의 Koray Kavukcuoglu: AI 사고를 사용하기 쉬운 제품으로 전환

59
0
Google의 Koray Kavukcuoglu: AI 사고를 사용하기 쉬운 제품으로 전환

Koray Kavukcuoglu는 DeepMind의 최고 기술 책임자이자 Google의 최고 AI 설계자입니다.

개발하는 일을 주도해 왔습니다. 쌍둥이자리 3지난 11월 출시된 빅테크 기업의 최신 AI 메이저(LLM). 모델의 새로운 기능 중 하나는 사용자 검색 쿼리를 기반으로 대화형 애플리케이션과 위젯을 만들 수 있다는 것입니다.

새로운 LLM의 가능성은 경쟁사의 관심을 끌었고 OpenAI CEO인 Sam Altman은 발표하다 “코드 레드”는 회사의 인기 챗봇인 ChatGPT를 수정하고 Google을 찾아야 한다는 것입니다.

Google의 장점은 회사가 전체 AI 스택을 소유하고 있다는 것입니다. 즉, 최첨단 AI 연구를 지원하는 도구, 데이터 센터, 칩 및 기타 것들을 보유하고 있다는 의미입니다. 주요 고객에게 직접 신제품을 출시할 수 있습니다.

Financial Times의 AI 기자 Melissa Heikkilä와의 인터뷰에서 Kavukcuoglu는 Gemini 3가 인기를 끄는 이유와 Google이 AI의 위대함을 향해 나아가는 데 어떻게 도움이 될 수 있는지 설명합니다.


멜리사 헤이킬: 당신은 2024년 초부터 DeepMind의 최고 기술 책임자였으며 지난 여름에는 Google의 최고 AI 설계자라는 새로운 역할을 맡았습니다. 훌륭한 AI 설계자는 어떤 일을 하나요?

코레이 카부쿠오글루: 우리는 가장 중요한 기술을 개발하고 있습니다. 그리고 제가 가진 첫 번째이자 가장 중요한 것은 우리의 AI 개발과 우리 제품이 잘 연결되어 있는지 확인하는 것입니다.

우리는 모든 Google 제품, 모든 Google 도메인에서 우리가 구축하고 있는 AI 기술을 사용할 수 있도록 하고 싶습니다. 그래서 Google DeepMind에서는 최첨단 기술을 구축하고 있습니다. [where] 우리의 목표는 AGI를 구축하는 것입니다 [artificial general intelligence — machines that surpass human capabilities and intelligence]. 사용자와의 상호작용을 통해 이를 수행하는 것이 중요하며 이는 제품을 통해 수행됩니다. 그러기 위해서는 우리 제품이 우리의 최첨단 기술을 활용할 수 있어야 합니다.

이는 이를 대규모로 수행할 수 있는 새로운 도구가 필요한 새로운 기술입니다. 이것이 바로 제가 가지고 있는 영역입니다. 저는 변화를 만들고, 개발하고, 작업하여 최고의 기술을 얻을 수 있고, 우리는 가장 좋은 방법으로 사용자와 연결할 수 있습니다.

© 댄 키트우드/게티 이미지

엠: Gemini 3를 맥락에 맞게 이해할 수 있도록 도와주세요. 일반인의 경우 우리는 다양한 유형의 새로운 AI를 보아왔고 모두 발전하고 있는 것 같습니다. AI가 아닌 많은 사람들은 아마도 OpenAI의 GPT-5가 조금 실망스럽다고 느꼈을 것입니다. 그렇다면 Gemini 3가 왜 그렇게 큰 문제입니까? 그리고 이것이 Google에 왜 그렇게 중요한가요? 그리고 그것이 AI 경쟁에서 당신을 어떻게 위치시키나요?

KK: 우리의 관점에서는 사용자에게 매우 중요한 멀티모달에 대한 이해에 있어 또 다른 큰 발걸음을 내디뎠다고 느끼기 때문에 중요합니다. 우리가 가지고 있는 것은 단순한 텍스트가 아닙니다. 우리가 가지고 있는 것은 다양한 형태로 나타납니다. 그렇기 때문에 노트북LM [Google’s AI research and note-taking assistant] 매우 인기가 있고, [because] 사람들은 좋아해요. . . 에게 [upload] 모든 종류의 문서 그리고 . . . 에 관해 질문하다 [them].

그래서 그 스킬을 늘리면 . . . 사람들의 비디오, 사진, PDF 등 모든 것에 대해 좋은 지식을 갖는 것은 큰 진전입니다. 그리고 우리 사용자들도 그들이 얻는 피드백과 정보의 종류에 있어 큰 진전을 볼 수 있기를 바랍니다.

두 번째는 코딩입니다. 하지만 코딩은 프로그래머만을 위한 것이 아닙니다. 편견이 학습에 점점 더 영향을 미치고 있습니다.

[With Gemini’s generative user interfaces]사람들이 질문을 하면 명확한 답변, 즉석에서 배울 수 있는 답변과 비유, 그리고 배우고 시험해 볼 수 있는 작은 위젯을 얻게 됩니다.

그런 종류의 발전을 좀 더 시각적이고 효율적이며 사용자 친화적인 것으로 바꿀 수 있다면 그것이 바로 변화를 가져올 것이라고 생각합니다. 함께 그렇게 할 수 있다는 것이 우리가 가진 것과 차별화되는 점입니다. 우리는 샘플만 공개하는 것이 아닙니다. 우리는 최고의 제품과 함께 출시하고 있습니다 [out] 사용자 인터페이스와 사용자 상호 작용을 통해 우리가 보유한 전체 팀을 구축하고 있습니다.

엔지니어링 측면에서는 반중력 [Google’s AI-powered integrated development environment] 새로운 코드 생성 방법을 출시합니다. 첫 번째 조수 [where software can act autonomously and independent of human input] 사회 발전 코드는 큰 진전입니다. 그리고 모델은 그 높은 수준, 그 보이지 않는 수준에서 행동할 수 있는 능력, 보조자 역할을 할 수 있는 능력을 갖고 있기 때문입니다.

엠: 이 모델을 가능하게 한 연구 및 기술 발전 과정을 안내해 주실 수 있나요?

KK: 모델 개발에 들어가는 금융 기술에는 다양한 영역이 있습니다. 사전 훈련부터 시작됩니다. 수업 시작 전 [where the model is trained on a dataset] 특히 인프라에 관해서는 좋은 인프라가 있고, 좋은 인프라가 있고, 얻은 데이터, 훈련한 데이터를 아주 잘 이해할 수 있습니다. 우리는 우리의 일을 열심히 추진해 왔습니다. 우리는 이를 수행할 수 있는 능력에 매우 만족하고 있습니다.

기본 훈련은 데이터를 이해하는 모델이 있기 때문에 이점을 제공합니다. [not only] 그것은 데이터에 더 많은 것을 담고 있지만 그 잠재력도 있습니다. 제품에 표시되는 방식은 교육을 통과한 후 모델이 제품 사용자와 상호 작용하는 방법을 학습하는 것입니다.

대학원 측면에서는 에이전트의 품질과 작성 및 이해 능력을 향상시키는 다양한 발전이 있었습니다. 모델은 사용자가 묻는 질문에 대해 조사 중에 인터넷에서 찾은 이미지가 포함된 표를 표시할 것임을 알고 있습니다.

그러나 다른 질문에 대해서는 위젯이라는 예를 보여주기 위해 작은 프로그램을 작성하도록 선택할 것입니다. 그래서 모델이 이를 결정합니다. 그리고 이것이 모두 이유입니다. . . 코딩과 에이전시.

사전 교육 측면, 교육 후 측면, 회사 전체에서 이 모든 것이 함께 어우러져 이 모든 것에 도움이 되었습니다.

엠: 이를 위해 필요한 컴퓨팅 성능은 정말 놀랍습니다. 돈은 어떻게 벌어요?

KK: 가장 중요한 것은 충전 방법입니다. 나는 거기에 독특한 접근 방식이 있다고 생각합니다. 둘째, 우리는 제품과 함께 이 일을 하고 있습니다. 우리가 하는 모든 일, 첨단 기술의 개발, 그리고 이러한 모델을 사용자에게 출시할 때, 이 모든 것은 우리가 제품을 사용하여 이를 수행하고 수십억 명의 사람들이 제품을 사용하며 그것이 어디에서 중요한지, 사람들이 이것을 어떻게 사용하고 싶어하는지 확인한다는 사실에 기초합니다.

그리고 저는 그것이 우리가 하는 모든 기술 개발이 사용자로부터 받는 피드백에 의해 주도되는 여기서 가장 중요한 것이라고 생각합니다. 그 안정성은 우리에게 중요하고 독특합니다.

엠: Google은 Gemini 3가 진정한 종합 보조원이자 보조원의 모습에 대한 비전을 향한 첫 번째 단계라고 말합니다. 이것이 우리가 인공지능에게 기대하는 모습과 느낌일까요?

KK: 나는 당신에게 솔직하게 말할 수 없습니다. 우리가 하는 모든 일은 그것을 위한 것입니다. 분명히 우리는 AGI를 구축하려고 노력하고 있습니다. 그것이 우리의 일입니다. 그것이 우리의 목표입니다. 하지만 나에게 매우 중요한 한 가지는 우리에게는 . . . AGI를 만드는 방법의 비밀 [because it is still research]. 그렇기 때문에 올바른 콘텐츠를 만들고, 올바른 콘텐츠를 선택하고, 사용자 신호를 이해하는 것이 중요합니다. [what guides our] 기술 개발.

AGI는 사용자에게 유용할 것이기 때문입니다. 그래야합니다. 그것이 우리가 구축하려는 것입니다. 이를 수행하는 유일한 방법은 똑똑한 사용자로부터 신호를 받는 것입니다. 그렇기 때문에 우리는 안전과 보안을 염두에 두고 처음부터 모델을 구축하려고 노력한다고 말할 때 그렇게 하지만 제품을 통해서도 그렇게 합니다.

그리고 Google은 수십억 명의 사용자에게 다가가는 길고도 성공적인 역사를 갖고 있습니다. 그리고 우리는 이를 통해 사용자가 필요로 하는 부분이 무엇인지, 기술이 실제로 사용자의 문제를 해결해야 하는 부분이 무엇인지 보여줍니다. 이것이 바로 우리가 구축하려는 AGI로 가는 길입니다.

엠: 또한 Gemini 3는 AI 출력 모델의 전형적인 특징인 진부함과 매력을 피한다고 말씀하셨습니다. 왜? 당신은 무엇을 했나요?

KK: 모델의 개성이 중요합니다. 사람들이 모델이 어떤 느낌을 갖기를 원하는지에 관해 많은 논의가 있습니다. 우리가 가진 장점 중 하나는 외부 파트너, 기업, 내부 자원과 협력한다는 점이라고 생각합니다. 각 제품에는 내부에도 작은 것이 들어 있습니다. 우리는 모델의 성격을 계산하는 방법에 대해 더 자세히 알아봤습니다. 아첨은 우리가 찾는 이러한 차원 중 하나입니다. 여기에 황금 답이 있다고 주장할 수 있는 사람은 아무도 없을 것 같습니다.

그러나 우리는 효율적이고 다양한 영역에서 유용한 모델을 만드는 방법을 이해하기 위해 몇 가지 조치를 취했다고 생각합니다. 중요한 것 중 하나는 모델이 사용자가 원하는 정보를 너무 많이 벗어나거나 너무 많이 그리지 않고 제공한다는 것입니다.

때로는 사용해야 할 때도 있습니다. 대부분의 경우 우리는 그것이 필요하지 않다는 것을 알고 있습니다.

Gemini 3 대화를 보여주는 Google Gemini 앱이 표시된 iPhone을 들고 있는 사람.
Kavukcuoglu는 ‘우리는 Gemini 3에 등록하지 않았습니다’라고 말합니다. © 스미스 컬렉션/가도/게티 이미지

엠: 제미니 3의 성격을 어떻게 설명하시겠습니까?

KK: 우리는 쌍둥이자리의 의미를 언급한 적이 없습니다. 물론 이후의 연구에서는 자신의 경험만을 사용합니다. 하지만 우리에게는 능력과 진실이 더 중요하며 단순한 언어입니다.

엠: 그리고 AI 연구와 분야에 대해 좀 더 구체적으로 말하자면, 과학자로서 현재 AI에 관심을 갖고 있는 부분은 무엇입니까?

KK: 지금은 모든 것이 빠르게 움직이고 있습니다. 실제 사용 사례에서 얻은 모델의 결과를 확인하고 있기 때문에 빠르게 움직이고 있습니다. 사람들은 업무, 연구, 연구에서 이러한 모델을 사용하고 참여하고 있습니다.

저에게는 이러한 모델에서 더 나은 에이전트를 만드는 방법을 배우면서 가장 흥미로운 일이 일어나고 있습니다. 왜냐하면 지원이라고 하면 대부분의 사람들이 코딩을 떠올리지만 그것은 단지 일부분일 뿐이기 때문입니다. 이것이 어떻게 사용되는지, 당신의 삶의 어떤 영역에 의존하고 있는지.

학습은 제가 가장 좋아하는 부분입니다. 왜냐하면 우리가 보고 있는 것은 갑자기 사용 가능한 것과 훨씬 더 풍부한 상호 작용을 얻을 수 있기 때문입니다. 따라서 우리는 사용자가 사용할 수 있는 콘텐츠를 매우 다양한 방식으로 통합할 수 있습니다. 그리고 스폰서가 좋아지면 이런 일을 점점 더 많이 보게 될 것이라고 생각합니다.

엠: 다음에 무엇을 기대할 수 있습니까?

KK: 우리는 그것을 만들기 위해 6개월 동안 열심히 일했습니다 [Gemini 3] 예를 들어 Gemini 2.5를 기반으로 사용자로부터 얻은 모든 신호와 이벤트를 포함하여 이를 구축했습니다. 소비자부터 까지 다양한 분야의 피드백을 받겠습니다. . . 제조업체, 기업. 우리의 목표는 이것을 이해하는 것입니다.

필연적으로 격차가 발생하고 그 격차가 메워질 것입니다. 그리고 이를 통해 우리는 사람들이 해결하려고 하는 중요한 문제도 이해하게 될 것입니다. 모델링에서 특정 수준의 품질이나 정확성을 달성하면 사람들은 더욱 창의적으로 더 열심히 노력할 것입니다. 그러므로 이 기술을 배우는 것이 다가올 것입니다.

이 게시물은 간결성과 명확성을 위해 편집되었습니다.

원천

LEAVE A REPLY

Please enter your comment!
Please enter your name here