Yapay Zeka Geliştirme

MAKER: Milyon Adımlı, Sıfır Hatalı LLM Akıl Yürütme Yanılsamasını Kırmak

Güncellenme 13 Kasım 2025

Kategori: Yapay Zeka Geliştirme

Paylaş

Etiketler AI Agents LLM Scaling Massively Decomposed Agentic Processes Error Correction AI Development

MAKER milyon adımlı sıfır hatalı LLM akıl yürütme görselleştirmesi

Yapay zeka, gökdelenler inşa etmekten ulusal lojistiği yönetmeye kadar insan organizasyonları ve toplumları ölçeğindeki sorunları çözmek için kusursuzca yürütülmesi gereken çok sayıda adım gerçekleştirmelidir. Ancak, akıl yürütme ve araç kullanımı konusunda kayda değer atılımlara rağmen, Büyük Dil Modelleri (LLM’ler), uzun, birbirine bağımlı eylem dizileri gerektiren görevlerde sürekli olarak başarısız olmuştur.

Bu, MAKER’ın ele aldığı zorluktur. UT Austin ile işbirliği içindeki AI Lab’daki araştırmacılar tarafından geliştirilen MAKER, sıfır hata ile bir milyondan fazla LLM adımı gerektiren bir görevi başarıyla çözen ilk sistemdir. Bu başarı, yapay zekayı ölçeklendirmek için yeni bir paradigma sunar: Kitlesel Ayrılmış Ajan Süreçleri (MDAP’ler).

Sağlam yapay zeka sistemleri oluşturmak isteyen bir geliştirici, ölçeklenebilir operasyonlar hedefleyen tek kurucu veya ajan iş akışlarını taslak haline getiren bir tasarımcı olun, MAKER güvenilir, büyük ölçekli yapay zeka geliştirme için bir şablon sunar.

Büyük Beyinden Ajan Sürüsüne

LLM Güvenilirlik Uçurumu

Mevcut LLM’ler, ölçeklendirmeyi engelleyen kalıcı bir hata oranından muzdariptir. Görevler çok sayıda birbirine bağımlı mantıksal adım içerdiğinde, küçük hatalar bile hızla katlanarak büyüyerek yıkıcı bir başarısızlığa yol açar.

Hanoi Kuleleri gibi benchmark’lar kullanan deneyler bu “güvenilirlik uçurumunu” canlı bir şekilde göstermektedir. Standart modeller basit versiyonlarda iyi performans gösterir ancak görev yaklaşık sekiz diski aştığında tamamen başarısız olur. Sadece %1’lik bir adım başına hata oranına sahip bir sistemin, milyon adımlı bir görevde sadece 100 adımdan sonra başarısız olması beklenir.

Görev karmaşıklığı arttıkça akıl yürütme modellerinde doğruluk çöküşü. Claude 3.7 Thinking ve DeepSeek R1 gibi sınır akıl yürütme modelleri düşük karmaşıklıkta iyi performans gösterir ancak Hanoi Kuleleri'nde sekiz diskten sonra tamamen başarısız olur.

MAKER, tek bir “akıllı” LLM’i sürekli iyileştirmeye odaklanmak yerine, doğası gereği hata toleranslı bir sistem mimarisi tasarlayarak bu temel sorunu ele alır.

Yapay zekayı ölçeklendirmede dik yönler - MAKER, diğer LLM'lerle karşılaştırıldığında 1 milyondan fazla art arda hatasız adım başarır

MAKER’ı Anlamak: Yapıyı Kullanarak Zekayı Ölçeklendirmek

MAKER; Maksimal Ajan Ayrıştırması, Kadar İleriye İlk Hata Düzeltmesi ve Kırmızı Bayraklama anlamına gelen bir kısaltmadır ve MDAP çerçevesinin bir uygulamasıdır.

Temel içgörü, güvenilirliğin aşırı ayrıştırma ve yerel hata düzeltmesi yoluyla elde edilebileceğidir. Sonuçlar, kitlesel olarak ayrılmış ajan süreçlerinin (MDAP’ler), tek başına sürekli LLM iyileştirmesine güvenmek yerine, organizasyonlar ve toplumlar seviyesindeki sorunları verimli bir şekilde çözebileceğini göstermektedir.

MAKER üç temel bileşene dayanır:

1. Maksimal Ajan Ayrıştırması (MAD)

Uzun görevler için, çok adımlı akıl yürütme gerçekleştiren LLM’ler, bağlam arttıkça genellikle güvenilir olmaktan çıkar. MAD, görevi olası en küçük alt görevlere bölerek her birini odaklanmış bir mikro ajan atayarak bunu çözer.

Mikro Ajanlar, Mikro Roller: Her ajan sadece tek bir alt göreve atanır (maksimal ayrıştırma, m=1). Bu, ajanın bağlamını, tek bir adım için gerekli minimum bilgiyle sınırlar.
Verimlilik: Bu aşırı odaklanma, MAKER çerçevesi içinde uzun menzilli görevler için daha uygun maliyetli olduğu bulunan daha küçük, akıl yürütme yapmayan LLM’lerin kullanımına izin verir.

2. Kadar İleriye İlk Oylama

Modülerlik, alt görev seviyesinde etkili ve ölçeklenebilir hata düzeltmesine olanak tanır. MAKER çoklu ajan oylama şeması kullanır: birden fazla ajan bağımsız olarak aynı tek adımı çözmeye çalışır.

Yerel Uzlaşma: Bir eylem, diğer herhangi bir eylemden k fazla oy alana kadar aday eylemler örneklenebilir. Bu, “kadar ileriye ilk oylama” olarak bilinir.
Ölçeklenebilirlik Verimliliği: Gerekli oy eşiği, k_min, toplam adım sayısı (s) ile sadece logaritmik (Θ(ln s)) olarak artar. Bu ana bir bulgudur: MAD ile birleştirildiğinde, tüm görevi çözmenin genel beklenen maliyeti logaritmik doğrusal (Θ(s ln s)) olarak ölçeklenir. Buna karşılık, ajanlar birden fazla adım (m>1) ele alırsa, maliyet üssel olarak artar.

3. Kırmızı Bayraklama

Adım başına başarı oranını (p) artırmak için MAKER, özellikle korelasyonlu hatalar olmak üzere artan hata riskini gösteren yanıtları atmak için “kırmızı bayraklama” kullanır.

Kafa Karışıklığı Göstergeleri: MAKER, aşırı uzun veya yanlış formatlanmış olan yanıtları işaretler. Ön deneyler, daha uzun yanıtların daha fazla hata eğiliminde olduğunu ve yanlış formatlamanın genellikle kusurlu akıl yürütme ile ilişkili olduğunu göstermiştir.
Azaltma: Bu yanıtları atarak ve yeniden örnekleterek MAKER, başarı oranını (p) artırır ve korelasyonlu hataları anlamlı şekilde azaltır, böylece yerel başarısızlıkların yayılmasını sağlar.

Kanıt: 20 Diskli Hanoi Kulelerini Çözme

MAKER’ı doğrulamak için araştırmacılar, 20 diskli Hanoi Kuleleri bulmacasına uyguladı. Bu yapılandırma 2²⁰ - 1, yani 1.048.575, birbirine bağımlı adım gerektirir. Her tek adımın doğru bir şekilde yürütülmesi gerekiyordu.

gpt-4.1-mini (maliyet etkinliği için seçilen bir akıl yürütme yapmayan model) kullanılarak ve oylama eşiği k=3’e ayarlanarak, tam MAKER sistemi problemi kusursuzca çözdü. Sıfır hata ile bir milyondan fazla LLM adımının bu başarılı yürütülmesi, LLM tabanlı sistemleri büyük zaman ufuklarına ölçeklendirmenin mümkün olduğunu kanıtlar.

Süreç, sıfır hatalı bir çözüme doğru üssel yakınsama sergiledi, bu da MAKER’ın teorik verimliliğini doğruladı.

Kadar İleriye İlk Oylama ve İlk K Oylama yöntemleri arasındaki yakınsama karşılaştırması, örnekleme ve oylama turları boyunca kararsız adımlarda üssel azalmayı gösteriyor

Yapay Zeka Geliştirme, Tasarım ve Ölçeklendirme İçin Çıkarımlar

MAKER mimarisi, bir sonraki nesil yapay zeka ürünlerini oluşturan geliştiriciler, tasarımcılar ve tek kurucular için kritik içgörüler sunar:

1. Geliştirme ve Ajan Tasarımı

MAKER’ın başarısı, mikro hizmet mimarisinde bulunan prensipleri yansıtan Aşırı Ayrıştırma’ya dayanır:

Modülerlik: Her mikro ajan belirli bir göreve uyarlanabilir.
Bağımsız Geliştirme: Ajanlar izole edilmiş olarak güncellenebilir ve test edilebilir.
Başarısızlık için Tasarım: Sistem, oylama/hata düzeltmesi yoluyla tekil ajanların başarısızlığını tolere edecek şekilde doğası gereği tasarlanmıştır.

Geliştiriciler için bu, yatırımın sürekli en son, en büyük monolitik LLM’i kovalamak yerine yüksek derecede uzmanlaşmış, minimal bağlamlı mikro ajanlar oluşturmaya odaklanması gerektiğini gösterir.

2. Ölçeklendirme ve Maliyet Yönetimi (Tek Kurucular İçin)

MDAP’leri kullanarak, k (oy eşiği) artırılarak büyük görevler için yüksek başarı olasılığı korunabilir. Kritik olarak, sistemin maliyeti adım sayısı ile logaritmik doğrusal olarak ölçeklenir.

Bu çerçeve, en uygun maliyetli LLM’i seçmeye (c/p en aza indirgeme) olanak tanır. Şaşırtıcı bir şekilde, MAKER’da kullanıldığında daha küçük, akıl yürütme yapmayan modeller genellikle en iyi güvenilirlik-dolar oranını sağlar.
MAKER’ı çalıştırmanın toplam maliyeti, tek bir ajan veya kısmen ayrılmış bir sistem kullanmaktan çok daha verimli ölçeklenir.

3. Güvenlik ve Kontrol (Kurucular ve Meraklılar İçin)

MAKER, tek bir modele güvenmekten önemli ölçüde azaltılmış risklerle gelen gelişmiş yapay zeka için alternatif bir yol sunar.

Şeffaflık ve Denetim: Her adımın net bir şekilde tanımlanmış ve sınırlı bir odağı olduğu için, ajanların eylemleri sandıklamak, denetlemek ve kontrol etmek daha kolaydır.
Azaltılmış İşbirliği Riski: Her adım üzerinde birden fazla odaklanmış ajanı bağımsız olarak çalıştırmak, ajanların zararlı eylemler üretmek için işbirliği yapma yeteneğini önemli ölçüde azaltır.
Model Boyutu ve Risk: Çalışmanın büyük kısmı için daha küçük LLM’ler kullanma yeteneği, güçlü, daha az kontrol edilen modellerle ilişkili riskleri azaltır.

Ajanlı Yapay Zekanın Geleceği

MAKER, Hanoi Kuleleri’nde bilinen bir planın kusursuz yürütülmesini sergilerken, yapay zeka geliştirme için bir sonraki sınır, bu çerçeveyi yaratıcı içgörüler ele alacak şekilde genişletmektir—planlama, fikir üretimi ve doğrulama.

Tüm problem çözme hattını, yaratıcı kısımlar da dahil olmak üzere, ayrıştırarak ve MDAP prensiplerini uygulayarak, geliştiriciler, toplam adım sayısı ve belirli alt görev türleri önceden bilinmeyen karmaşık süreçleri otomatikleştirebilir.

MAKER, güvenilir, büyük ölçekli zekanın daha küçük, daha güvenli ve daha kontrollü sistemlerle elde edilebileceğini kanıtlar. Yapay zekanın geleceği sadece daha büyük modeller inşa etmeye bağlı değildir, basitçe başarısız olmayan daha akıllı, dağıtılmış sistemler tasarlamaya bağlıdır.

Paylaşmak istediğiniz bir yapay zeka aracı mı inşa ettiniz? AI projelerinizi sunabileceğiniz, her biri kişisel incelemem, sunum süreci detayları ve lansmanınız için en iyi platformları seçmenize yardımcı olacak kalite göstergeleri içeren özenle hazırlanmış bir yapay zeka dizinleri listesi derledim.

MAKER, “Solving a Million-Step LLM Task with Zero Errors” adlı ön baskında Elliot Meyerson, Giuseppe Paolo, Roberto Dailey ve diğerleri tarafından tanımlanmış ve “Shattering the Illusion: MAKER Achieves Million-Step, Zero-Error LLM Reasoning” blog yazısında yer almıştır.

Kategori Yapay Zeka Geliştirme

Paylaş

Etiketler AI Agents LLM Scaling Massively Decomposed Agentic Processes Error Correction AI Development

MAKER: Milyon Adımlı, Sıfır Hatalı LLM Akıl Yürütme Yanılsamasını Kırmak

MAKER milyon adımlı sıfır hatalı LLM akıl yürütme görselleştirmesi

LLM Güvenilirlik Uçurumu

MAKER’ı Anlamak: Yapıyı Kullanarak Zekayı Ölçeklendirmek

1. Maksimal Ajan Ayrıştırması (MAD)

2. Kadar İleriye İlk Oylama

3. Kırmızı Bayraklama

Kanıt: 20 Diskli Hanoi Kulelerini Çözme

Yapay Zeka Geliştirme, Tasarım ve Ölçeklendirme İçin Çıkarımlar

1. Geliştirme ve Ajan Tasarımı

2. Ölçeklendirme ve Maliyet Yönetimi (Tek Kurucular İçin)

3. Güvenlik ve Kontrol (Kurucular ve Meraklılar İçin)

Ajanlı Yapay Zekanın Geleceği

İlgili Yazılar

Comparing 5 AI Agent Frameworks (CrewAI, LangGraph, AutoGen, LangChain, Swarm)

Hierarchical Reasoning Model: Achieving 100x Faster Reasoning with 27M Parameters

Code Wiki: Google’s Living Repo Wiki That Keeps Docs in Sync (and Adds a Gemini Chat)

En son AI içgörülerini gelen kutunuza teslim alın

MAKER milyon adımlı sıfır hatalı LLM akıl yürütme görselleştirmesi

LLM Güvenilirlik Uçurumu

MAKER’ı Anlamak: Yapıyı Kullanarak Zekayı Ölçeklendirmek

1. Maksimal Ajan Ayrıştırması (MAD)

2. Kadar İleriye İlk Oylama

3. Kırmızı Bayraklama

Kanıt: 20 Diskli Hanoi Kulelerini Çözme

Yapay Zeka Geliştirme, Tasarım ve Ölçeklendirme İçin Çıkarımlar

1. Geliştirme ve Ajan Tasarımı

2. Ölçeklendirme ve Maliyet Yönetimi (Tek Kurucular İçin)

3. Güvenlik ve Kontrol (Kurucular ve Meraklılar İçin)

Ajanlı Yapay Zekanın Geleceği

İlgili Yazılar

Comparing 5 AI Agent Frameworks (CrewAI, LangGraph, AutoGen, LangChain, Swarm)

Hierarchical Reasoning Model: Achieving 100x Faster Reasoning with 27M Parameters

Code Wiki: Google’s Living Repo Wiki That Keeps Docs in Sync (and Adds a Gemini Chat)

İçindekiler

Popüler Konular

Popular Topics

En son AI içgörülerini gelen kutunuza teslim alın