Documentation Index
Fetch the complete documentation index at: https://lokomotifai.mintlify.app/llms.txt
Use this file to discover all available pages before exploring further.
Şantiyeden bir analoji
Usta vardiyayı bitirdiğinde işin tamamı bitmiş olmak zorunda değildir. Asıl yükümlülük başkadır: ertesi gün gelen ustanın işi nereden devam edeceğini bilmesi. Hangi duvar yarım kaldı, neden mavi yerine kırmızı tuğla seçildi, su tesisatı hangi katta kesildi. Bu yazılı değilse, ertesi gün şantiyeyle yeniden tanışılır. Daha kötüsü: dün takılan pencere bugün sökülür, yarın yine takılır. AI ajanlarının “vardiyaları” bağlam pencereleridir. 128K, 200K, hatta 1M — sayı önemli değil. Uzun bir görev eninde sonunda pencereyi doldurur. Pencere dolduğunda iki ihtimal vardır: sıkıştırma (compaction) ya da sıfırlama (reset). İkisi de düzenek (harness) tarafından açıkça tasarlanmamışsa, süreklilik kaybedilir. Düzenek Mühendisliği (Harness Engineering)‘nin görüşü nettir: unutkanlık varsayılan ayardır, süreklilik mühendislik ürünüdür.Tez
Uzun süren görevlerde güvenilirlik bağlam penceresinin değil, dosya sisteminin sorumluluğudur. “Ne yapıyordum, neyi neden seçtim, şu an nerede kaldım” sorularıPROGRESS.md ve DECISIONS.md gibi git-izli artefaktlarda yaşar. Bu artefaktlar vardiya alımı (clock-in) ve vardiya teslimi (clock-out) rutinleriyle dolaşıma sokulur. Düzenek, bu üçlüyü birinci sınıf vatandaş kabul ettiği ölçüde uzun görevleri taşır.
İki başarısızlık mekanizması
1) Bağlam endişesi ve erken yakınsama
Anthropic’in uzun-süreli ajanlar üzerine yayınladığı “Effective harnesses for long-running agents” yazısında belgelenen davranış şudur: pencere limite yaklaştıkça ajan “erken yakınsama (premature convergence)” sergiler. Yazının kendi ifadesiyle, ajanlar “projeyi vakitsizce tamamlanmış ilan eder” ya da her şeyi tek seferde yapmaya çalışıp “özellik ortasında bağlamı tüketir.” Sınavın bitmesine az kalmış bir öğrenci gibi kalan soruları rastlantıyla cevaplar; doğrulamayı atlar; “tamamlandı” der. Bu model kusuru değil, çevre kusurudur. Pencere yönetimini düzeneğe bırakırsan baskı stresli son dakikaya taşınır.2) Compaction “neden”i kaybeder
Modern ajanların çoğu pencere dolmadan önce sohbeti otomatik özetler. OpenHands’in context condensation yazısı bu kapsamda iyimser ve dürüsttür: özet hedefleri, ilerlemeyi, kritik dosyaları ve başarısız testleri korumaya çalışır; ölçüt olarak da kayda değer kazanımlar gösterir — “etkililikten ödün vermeden tur başına 2x’e varan API maliyet azalması” ve “yoğunlaştırma ile %54 problem çözme oranı, taban %53.” Yine de iyi tasarlanmış bir compaction bile bir şeyi tutarlı biçimde kaybeder: ara muhakeme. “B seçeneğini A yerine niye seçtim” cevabı genelde gidip gelen düşüncede gizlidir; özet sonunda yalnızca “B yapıldı” kalır. Compaction “ne”yi tutar; “neden”i kaybeder. Bir gün sonra başka bir oturum “neden A değil B?” sorusunun cevabını repoda bulamazsa, gönül rahatlığıyla yine A’yı önerir.Üç süreklilik artefaktı
Manus ekibinin “Context Engineering for AI Agents” yazısı bu noktada açık konuşur: dosya sistemini “Manus’ta nihai bağlam — boyutta sınırsız, doğası gereği kalıcı” sayarlar; sıkıştırma stratejilerinin “geri kazanılabilir (restorable)” olması, yani URL ve dosya yollarının korunması gerektiğini söylerler. Aynı yazıdan ikinci ders: küresel planı yeniden okutmak — todo dosyalarını sürekli güncellemek — “global planı modelin yakın dikkat menzilinin içine iter.” Aşağıdaki üç artefakt bu iki ilkenin somutlaşmasıdır.1) PROGRESS.md — vardiya defteri
2) DECISIONS.md — gerekçeli karar günlüğü
3) Vardiya rutinleri — AGENTS.md içinde
PROGRESS.md + DECISIONS.md ikilisini birinci sınıf yapan ilkedir.
Pratik
Yukarıdaki üç şablon (PROGRESS, DECISIONS, AGENTS rutinleri) repoda birebir bu yapıyla durur. Tek kural: her oturum bitişindePROGRESS.md’nin son commit’i tarihliyse, vardiya teslim edilmiştir. Aksi halde teslim alınmamıştır.
Tool dinamizmi için Manus’un kuralı: oturum içinde araç ekleme/çıkarma yerine araç maskeleme (tool masking). “Önceki gözlemler artık tanımlı olmayan araçlara referans verdiğinde” model şaşırır; uygun olmayanı kararken kullanılamaz hale getirmek KV-cache’i de korur.
Sayılarla
| Kaynak | Bulgu | Tutamak |
|---|---|---|
| Anthropic, Effective harnesses for long-running agents | Initializer ajan 200’den fazla özellikten oluşan bir feature list üretir; her özellik başlangıçta “failing” işaretlenir. | Özellik başı tek-adım iş bölümü, vardiyalar arası net teslim. |
| Manus, Context Engineering | KV-cache: önbellekli token 0.30 USD/MTok, önbelleksiz 3 USD/MTok — 10x fark. Tipik görev ~50 araç çağrısı. | Stabil prefix + filesystem-as-memory. |
| OpenHands, Context Condensation | Yoğunlaştırma ile tur başına 2x’e varan API maliyet azalması. %54 vs %53 problem çözme oranı. Karesel ölçeklenmeye karşı doğrusal ölçeklenme. | Hedef + ilerleme + kritik dosyalar + başarısız testler korunur. |
| Anthropic, Harness design for long-running apps | Solo koşu 20 dk / 200 (“20x daha pahalı”) ama “esaslı biçimde daha kaliteli çıktı.” | Süreklilik bedava değil; görev modelin solo kapasitesini aştığında kazanır. |
Pratik kontrol listesi
-
PROGRESS.mdrepo kökünde, son oturum tarihinde güncellenmiş. -
DECISIONS.mdher bağlayıcı kararı gerekçesi + reddedilen alternatif ile içerir. -
AGENTS.mdiçinde “vardiya alımı” ve “vardiya teslimi” rutinleri yazılı. - Oturum başında
make checkkoşturuluyor; başlangıç durumu kanıtlanıyor. - Oturum sonunda
make checkyeşil; commit atılmış. - Açık sorular kullanıcıya iletilmiş (örtük bırakılmamış).
- Sıkıştırma stratejisi restorable: URL ve dosya yolları özette korunuyor.
- Oturum içinde araç ekleme/çıkarma yok; gerektiğinde maskeleme kullanılıyor.
Müfredat içindeki yeri
Ders 04 talimatı bir yönlendiriciye indirgemişti; bu ders aynı yönlendiricinin altına zamansal bir defter koydu:PROGRESS.md, DECISIONS.md ve vardiya rutinleri. Unutkanlığı yapısal sorun olarak ele alıp dosya sistemine devrettik. Ders 06 — Önce Temel, Sonra Duvar bu defterlerin ne zaman açılacağını sabitler: feature kodu yazılmadan, ayrı bir başlangıç fazında.
Pratik karşılığı: Proje 03 — Çok Oturumlu Süreklilik. Aynı görevi iki oturumda — biri rutinsiz, biri rutinli — koşturup farkı belgelersiniz.