yapay zekada nasıl ustalaşılır (tam yol haritası):
Çoğu kişi yapay zekayı yanlış yerden öğrenmeye başlıyor. Model eğitmeye çalışıyor ama vektör nedir bilmiyor. Chatbot geliştiriyor ama dil modellerinin temellerine hakim değil.
9. maddeye kadar temel kavramlar üzerinde duracağız, sonrasında da ileri düzeye geçeceğiz.
Kısacası bu rehber, eksiksiz bir kavrayışla sıfırdan ileri düzeye ulaşmanız için tasarlandı.
Kimler için uygun derseniz de, hiçbir teknik altyapısı olmayanlar, kodlama bilgisi olup AI dünyasına adım atmak isteyenler, kendi ürününü geliştirmek isteyen girişimciler veya “neden çalıştığını” anlamadan sadece “nasıl çalıştığını” bilen herkes için diyebiliriz.
9. maddeye kadar temel kavramlar üzerinde duracağız, sonrasında da ileri düzeye geçeceğiz.
Kısacası bu rehber, eksiksiz bir kavrayışla sıfırdan ileri düzeye ulaşmanız için tasarlandı.
Kimler için uygun derseniz de, hiçbir teknik altyapısı olmayanlar, kodlama bilgisi olup AI dünyasına adım atmak isteyenler, kendi ürününü geliştirmek isteyen girişimciler veya “neden çalıştığını” anlamadan sadece “nasıl çalıştığını” bilen herkes için diyebiliriz.
1. Yapay Zekanın Temelleri
Başlamadan önce terminolojiyi oturtun. Kavramları netleştirmek karmaşayı ortadan kaldırır.
Yapay Zeka (AI): İnsan zekâsını taklit eden sistemler
Makine Öğrenmesi (ML): Kurallar yazılmadan, veriden öğrenen sistemler
Derin Öğrenme (DL): Sinir ağlarıyla çok katmanlı öğrenmeyi mümkün kılan ML alt dalı
Doğal Dil İşleme (NLP): Dili anlamaya ve üretmeye odaklı yapay zeka dalı
Bu farkları özümsemeden ileriye geçmek, temel yapı taşları eksik bir bina inşa etmek gibi bir şey olur, o nedenle burada anlamadıysanız bile atın GPT'ye bu tweeti, açıkla kardeşim diyin.
Başlamadan önce terminolojiyi oturtun. Kavramları netleştirmek karmaşayı ortadan kaldırır.
Yapay Zeka (AI): İnsan zekâsını taklit eden sistemler
Makine Öğrenmesi (ML): Kurallar yazılmadan, veriden öğrenen sistemler
Derin Öğrenme (DL): Sinir ağlarıyla çok katmanlı öğrenmeyi mümkün kılan ML alt dalı
Doğal Dil İşleme (NLP): Dili anlamaya ve üretmeye odaklı yapay zeka dalı
Bu farkları özümsemeden ileriye geçmek, temel yapı taşları eksik bir bina inşa etmek gibi bir şey olur, o nedenle burada anlamadıysanız bile atın GPT'ye bu tweeti, açıkla kardeşim diyin.
2. Dil Modellerinin Anatomisi
Bütün modern yapay zeka uygulamaları bir dile dayanır.
Ama o dil, insan dili değil, token dilidir.
Büyük Dil Modelleri (LLM): Milyarlarca kelimeyle eğitilen, bir sonraki kelimeyi tahmin eden modeller
Transformer Mimarisi: Bugünkü dil modellerinin temel taşıdır (GPT, BERT, Claude vs.)
Token Kavramı: AI için kelimeler değil, token’lar vardır. 1 token yaklaşık olarak 4 karaktere denk gelir.
"Merhaba" = 2 token
"Yapay zeka" = 3 token gibi düşünebilirsiniz.
Bağlam Penceresi (Context Window): Modelin “hatırlayabileceği” maksimum token sayısıdır
GPT-4: 128K
Claude 3 Opus: 200K+
Token yönetimi, sadece maliyeti değil, performansı da doğrudan etkiler.
Bütün modern yapay zeka uygulamaları bir dile dayanır.
Ama o dil, insan dili değil, token dilidir.
Büyük Dil Modelleri (LLM): Milyarlarca kelimeyle eğitilen, bir sonraki kelimeyi tahmin eden modeller
Transformer Mimarisi: Bugünkü dil modellerinin temel taşıdır (GPT, BERT, Claude vs.)
Token Kavramı: AI için kelimeler değil, token’lar vardır. 1 token yaklaşık olarak 4 karaktere denk gelir.
"Merhaba" = 2 token
"Yapay zeka" = 3 token gibi düşünebilirsiniz.
Bağlam Penceresi (Context Window): Modelin “hatırlayabileceği” maksimum token sayısıdır
GPT-4: 128K
Claude 3 Opus: 200K+
Token yönetimi, sadece maliyeti değil, performansı da doğrudan etkiler.
3. Parametreler ve Ayarların Anlam
LLM'ler davranışlarını ayarlayabileceğiniz mekanizmalar sunar.
Temperature: Rastlantısallık düzeyini belirler
0.0: Aynı giriş = Aynı çıktı
0.7: Dengeli, doğal cevaplar
1.5+: Kaotik, bazen yaratıcı bazen anlamsız
Hatta en basit düzeyde LLM ile iletişime geçerken prompt içerisinde bile bu parametreyi ayarlamasını söylerseniz farkı görebilirsiniz.
Top-p (Nucleus Sampling): Modelin yanıt aralığını sınırlar
Frequenzy Penalty & Presence Penalty: Tekrarlayan veya benzer kelimelerin kullanımını azaltmak için kullanılır
Basit mantıkla düşünün, doğru ayar doğru davranış demektir. LLM’leri ustaca kullanmak istiyorsanız bu ayarları öğrenmelisiniz.
LLM'ler davranışlarını ayarlayabileceğiniz mekanizmalar sunar.
Temperature: Rastlantısallık düzeyini belirler
0.0: Aynı giriş = Aynı çıktı
0.7: Dengeli, doğal cevaplar
1.5+: Kaotik, bazen yaratıcı bazen anlamsız
Hatta en basit düzeyde LLM ile iletişime geçerken prompt içerisinde bile bu parametreyi ayarlamasını söylerseniz farkı görebilirsiniz.
Top-p (Nucleus Sampling): Modelin yanıt aralığını sınırlar
Frequenzy Penalty & Presence Penalty: Tekrarlayan veya benzer kelimelerin kullanımını azaltmak için kullanılır
Basit mantıkla düşünün, doğru ayar doğru davranış demektir. LLM’leri ustaca kullanmak istiyorsanız bu ayarları öğrenmelisiniz.
4. Prompt Mühendisliği
LLM'lerin performansı, verdiğiniz promptun kalitesine bağlıdır.
Kötü bir prompt, en gelişmiş modeli bile işe yaramaz hale getirir.
Rol tanımı: "Sen bir editörsün…" gibi başlangıçlar modele bağlam kazandırır
Örnekleme: İstediğiniz çıktının örneğini verin
Zincirleme prompt: Karmaşık sorunları aşamalandırarak çözdürün
Format kontrolü: JSON, tablo, madde listesi gibi açık biçimler talep edin
Prompt mühendisliği, yazılım mühendisliğinin yeni dili olacak. Bunu ben değil, elon musk gibi, naval gibi, ilya gibi insanlar söylüyor. O nedenle ciddiye alsanız iyi olur, 110 IQ türk twitter yazılımcısının prompt mühendisliği hakkındaki söylemlerini pek umursamayın.
LLM'lerin performansı, verdiğiniz promptun kalitesine bağlıdır.
Kötü bir prompt, en gelişmiş modeli bile işe yaramaz hale getirir.
Rol tanımı: "Sen bir editörsün…" gibi başlangıçlar modele bağlam kazandırır
Örnekleme: İstediğiniz çıktının örneğini verin
Zincirleme prompt: Karmaşık sorunları aşamalandırarak çözdürün
Format kontrolü: JSON, tablo, madde listesi gibi açık biçimler talep edin
Prompt mühendisliği, yazılım mühendisliğinin yeni dili olacak. Bunu ben değil, elon musk gibi, naval gibi, ilya gibi insanlar söylüyor. O nedenle ciddiye alsanız iyi olur, 110 IQ türk twitter yazılımcısının prompt mühendisliği hakkındaki söylemlerini pek umursamayın.
5. Embedding
Modeller sadece kelimeleri değil, anlamları temsil eder.
Embedding: Bir kelimenin/anlamın çok boyutlu vektörler halinde temsil edilmesidir. Benim nazarımda AI alanındaki en keyifli ve işlevsel konulardan birisidir
Kullanım alanları: Arama motorları, öneri sistemleri, semantik analiz
Yalnız dikkat edilmesi gereken önemli nokta şu ki aynı anlama gelen cümlelerin embedding vektörleri birbirine yakın olur. Klasik veri işlemektense anlam bazlı veri işleme olarak düşünebilirsiniz. Çok fazla kapı açar kapatır.
Kısacası embedding, veriyi kelime yerine “anlam” düzeyinde işlemenizi sağlar.
Modeller sadece kelimeleri değil, anlamları temsil eder.
Embedding: Bir kelimenin/anlamın çok boyutlu vektörler halinde temsil edilmesidir. Benim nazarımda AI alanındaki en keyifli ve işlevsel konulardan birisidir
Kullanım alanları: Arama motorları, öneri sistemleri, semantik analiz
Yalnız dikkat edilmesi gereken önemli nokta şu ki aynı anlama gelen cümlelerin embedding vektörleri birbirine yakın olur. Klasik veri işlemektense anlam bazlı veri işleme olarak düşünebilirsiniz. Çok fazla kapı açar kapatır.
Kısacası embedding, veriyi kelime yerine “anlam” düzeyinde işlemenizi sağlar.
6. Uygulama Zamanı: API’lerle Model Kullanımı
Modeli anlamak kadar onu programlı bir biçimde kullanmak da önemlidir.
OpenAI, Anthropic, Cohere, Mistral, Google gibi API sağlayıcıları
Python ile API entegrasyonu
Yanıt yönetimi, gecikme optimizasyonu, hataya karşı savunmalar
Otomatik görev sistemleri (agent sistemleri)
Teoriyi pratiğe dönüştürmeden uzmanlık olmaz. O nedenle eğer geliştirme kısmına merak salıyorsanız en azından bunun arkasında yatan mantığı kavrayın.
Modeli anlamak kadar onu programlı bir biçimde kullanmak da önemlidir.
OpenAI, Anthropic, Cohere, Mistral, Google gibi API sağlayıcıları
Python ile API entegrasyonu
Yanıt yönetimi, gecikme optimizasyonu, hataya karşı savunmalar
Otomatik görev sistemleri (agent sistemleri)
Teoriyi pratiğe dönüştürmeden uzmanlık olmaz. O nedenle eğer geliştirme kısmına merak salıyorsanız en azından bunun arkasında yatan mantığı kavrayın.
7. Fine-tune ve Kendi Modellerinizi Eğitme
Bu aşama ileri düzeydir. Ama kavrayışınız güçlendikçe buna hazır olacaksınız.
Fine-tuning: Mevcut bir modeli özel bir veri setiyle yeniden eğitmek
LoRA / QLoRA: Hafifletilmiş ve maliyeti düşüren fine-tuning yöntemleri
Dataset hazırlama: Kaliteli veri her şeyin temelidir, modelleri eğiteceğiniz veri seti bu da.
Sadece büyük veri değil, doğru yapılandırılmış veri gereklidir. Yani yüzbinlerce gigabytlık çöp veri yerine yüz bin katı daha ufak ama iyi odaklı veri daha iyi sonuç almanızı sağlar.
Bu aşama ileri düzeydir. Ama kavrayışınız güçlendikçe buna hazır olacaksınız.
Fine-tuning: Mevcut bir modeli özel bir veri setiyle yeniden eğitmek
LoRA / QLoRA: Hafifletilmiş ve maliyeti düşüren fine-tuning yöntemleri
Dataset hazırlama: Kaliteli veri her şeyin temelidir, modelleri eğiteceğiniz veri seti bu da.
Sadece büyük veri değil, doğru yapılandırılmış veri gereklidir. Yani yüzbinlerce gigabytlık çöp veri yerine yüz bin katı daha ufak ama iyi odaklı veri daha iyi sonuç almanızı sağlar.
8. Çok Modlu Sistemler ve Gelecek Perspektifi
Sadece metin değil, ses, görsel, video gibi çoklu veri kaynakları da yapay zekanın bir parçası.
Görsel + Metin Modelleri: GPT-4V, Gemini, Claude 3
Sesli Asistanlar: Whisper, Voice AI, ElevenLabs
Otonom Agentlar: Görev tabanlı, planlama yapabilen yapay zekalar, mesela Manus
Simülasyon ortamları ve dünya modelleri: Modelin kendi başına “düşünebilmesi” için gerekli bileşenler. Mesela Stanford Westworld deneyi.
Sadece yazılı komutlarla çalışan yapay zekaların devri kısa süre içinde kapanacak, çok boyutlu veriyle çalışan yapay zekalara yöneliyoruz.
Sadece metin değil, ses, görsel, video gibi çoklu veri kaynakları da yapay zekanın bir parçası.
Görsel + Metin Modelleri: GPT-4V, Gemini, Claude 3
Sesli Asistanlar: Whisper, Voice AI, ElevenLabs
Otonom Agentlar: Görev tabanlı, planlama yapabilen yapay zekalar, mesela Manus
Simülasyon ortamları ve dünya modelleri: Modelin kendi başına “düşünebilmesi” için gerekli bileşenler. Mesela Stanford Westworld deneyi.
Sadece yazılı komutlarla çalışan yapay zekaların devri kısa süre içinde kapanacak, çok boyutlu veriyle çalışan yapay zekalara yöneliyoruz.
9. Agent Sistemleri ve Otonomi
Buraya kadar öğrendiğin her şey bir temeldi. Şimdi bu temelin üzerine sistem kurmayı öğreniyorsun. Agentlar, birden fazla adımı planlayıp kendi başlarına yürütme kapasitesine sahip yapay zeka birimleridir.
Sadece cevap üretmezler, görev alır, plan yapar, duruma göre yön değiştirirler.
Ana Bileşenler:
Planlayıcı (Planner): Hedefi parçalara ayırır
Bellek (Memory): Kısa ve uzun vadeli bilgileri tutar
Yürütücü (Executor): Alt görevleri yerine getirir
Refleksiyon (Reflection): Kendi kararlarını değerlendirip tekrar plan yapar
Araçlar:
LangGraph / AutoGPT / CrewAI / Manus
Pinecone / Weaviate ile vektör belleği
Arama motoru + API entegreli agent zincirleri
Amaç modelleri pasif cevaplayıcıdan çıkarıp, aktif problem çözücülere dönüştürmek.
Buraya kadar öğrendiğin her şey bir temeldi. Şimdi bu temelin üzerine sistem kurmayı öğreniyorsun. Agentlar, birden fazla adımı planlayıp kendi başlarına yürütme kapasitesine sahip yapay zeka birimleridir.
Sadece cevap üretmezler, görev alır, plan yapar, duruma göre yön değiştirirler.
Ana Bileşenler:
Planlayıcı (Planner): Hedefi parçalara ayırır
Bellek (Memory): Kısa ve uzun vadeli bilgileri tutar
Yürütücü (Executor): Alt görevleri yerine getirir
Refleksiyon (Reflection): Kendi kararlarını değerlendirip tekrar plan yapar
Araçlar:
LangGraph / AutoGPT / CrewAI / Manus
Pinecone / Weaviate ile vektör belleği
Arama motoru + API entegreli agent zincirleri
Amaç modelleri pasif cevaplayıcıdan çıkarıp, aktif problem çözücülere dönüştürmek.
10. Yapay Zeka ve Anlama
Bir modelin “anlaması” demek, aslında onun olasılıkları dağıtabilmesi demektir. LLM’ler, temelinde bilgi kuramına dayanır: Entropi, sürpriz, olasılık, sembolik yoğunluk.
Kavramlar:
Enformasyon Teorisi: Claude Shannon’ın izinden, bir mesajın belirsizliğini ölçmek
Minimum Description Length: İyi modellerin veriyi sıkıştırabilme yeteneği
Bayes Kuralı: İnanç güncellemesi. LLM’lerin ön kabul + bağlam temeli
Kolmogorov Karmaşıklığı: Bir yapının açıklanabilirliği, sıkıştırılabilirliği
LLM bu noktada üzerindeki "yapay" ibaresini atar ve gerçek “zeka” burada başlar. Çünkü zeka, olasılık dağılımı tahminiyle başlar.
Bir modelin “anlaması” demek, aslında onun olasılıkları dağıtabilmesi demektir. LLM’ler, temelinde bilgi kuramına dayanır: Entropi, sürpriz, olasılık, sembolik yoğunluk.
Kavramlar:
Enformasyon Teorisi: Claude Shannon’ın izinden, bir mesajın belirsizliğini ölçmek
Minimum Description Length: İyi modellerin veriyi sıkıştırabilme yeteneği
Bayes Kuralı: İnanç güncellemesi. LLM’lerin ön kabul + bağlam temeli
Kolmogorov Karmaşıklığı: Bir yapının açıklanabilirliği, sıkıştırılabilirliği
LLM bu noktada üzerindeki "yapay" ibaresini atar ve gerçek “zeka” burada başlar. Çünkü zeka, olasılık dağılımı tahminiyle başlar.
11. Model Mimarilerinin Evrimi ve Donanım Gereksinimleri
Bugün bir modeli nasıl kullandığımız kadar, nasıl eğittiğimiz de önemlidir.
Mimariler:
Transformer (2017–2023): Tüm dikkati yöneten mimari
Mixture-of-Experts (MoE): Her göreve özel nöronları aktifleştiren sistemler (google bard, qwen)
Sparse Attention/Linear Transformers: Bellek ve hız optimizasyonları
Retrieval-Augmented Generation (RAG): Modelin dış veri kaynaklarını çağırabilmesi (langchain)
Donanım:
GPU mimarileri (A100, H100, MI300): yapay zekanın motorudur.
Lokalde çalıştırmak için gerekli VRAM hesaplama: (model boyutu x quant boyutu/8)x1.2
TPU, LPU ve özel ASIC'ler: Model türüne göre donanım seçimi
Model quantization ve pruning: Hafifletme teknikleriyle devasa modelleri edge cihazlarda çalıştırma
Kod bilgisi sizi bir noktaya getirir, mimari bilgisi ise sınıf atlatır. O nedenle önemli. Daha fazla bilgi edinmek istiyorsanız redditte r/ollama 'ya katılın, biraz okuyun bu konuda ne kadar kafa yakmış adam varsa orada.
Bugün bir modeli nasıl kullandığımız kadar, nasıl eğittiğimiz de önemlidir.
Mimariler:
Transformer (2017–2023): Tüm dikkati yöneten mimari
Mixture-of-Experts (MoE): Her göreve özel nöronları aktifleştiren sistemler (google bard, qwen)
Sparse Attention/Linear Transformers: Bellek ve hız optimizasyonları
Retrieval-Augmented Generation (RAG): Modelin dış veri kaynaklarını çağırabilmesi (langchain)
Donanım:
GPU mimarileri (A100, H100, MI300): yapay zekanın motorudur.
Lokalde çalıştırmak için gerekli VRAM hesaplama: (model boyutu x quant boyutu/8)x1.2
TPU, LPU ve özel ASIC'ler: Model türüne göre donanım seçimi
Model quantization ve pruning: Hafifletme teknikleriyle devasa modelleri edge cihazlarda çalıştırma
Kod bilgisi sizi bir noktaya getirir, mimari bilgisi ise sınıf atlatır. O nedenle önemli. Daha fazla bilgi edinmek istiyorsanız redditte r/ollama 'ya katılın, biraz okuyun bu konuda ne kadar kafa yakmış adam varsa orada.
12. AGI ve Etik Sınırlar
Yapay zekayı sadece bir araç olarak görmek, onu eksik anlamaktır. Bir noktadan sonra, neyin mümkün olduğu değil, neyin yapılabilir olduğu sorusu sorulur ki o soru sorulduğunda da bir ton alt soru ortaya çıkar.
Tartışmalar:
AGI tanımı: Yalnızca dil mi, yoksa soyutlama, planlama ve niyet mi? AGI gerçekten nedir sorusuna 500 farklı yanıt alırsınız, Grok4 AGI mı sorusunun nedeni de bu.
İçsel bilinç sorunu: LLM'ler bilince yakın mı? Yoksa bir yanılsama mı yaratıyorlar?
Kontrol problemleri: Kendi görevlerini belirleyebilen bir model nasıl denetlenir?
Değer yükleme: Modelin “iyi” ya da “kötü” eylem üretmemesi için değerleri kim belirleyecek? LLM için iyi veya kötü nedir?
AGI'ın sınırı teknik değil, felsefidir. Bilgi bir yere kadar iş görüyor, sonrası tuhaf yerlere çıkan bir konu bu.
Yapay zekayı sadece bir araç olarak görmek, onu eksik anlamaktır. Bir noktadan sonra, neyin mümkün olduğu değil, neyin yapılabilir olduğu sorusu sorulur ki o soru sorulduğunda da bir ton alt soru ortaya çıkar.
Tartışmalar:
AGI tanımı: Yalnızca dil mi, yoksa soyutlama, planlama ve niyet mi? AGI gerçekten nedir sorusuna 500 farklı yanıt alırsınız, Grok4 AGI mı sorusunun nedeni de bu.
İçsel bilinç sorunu: LLM'ler bilince yakın mı? Yoksa bir yanılsama mı yaratıyorlar?
Kontrol problemleri: Kendi görevlerini belirleyebilen bir model nasıl denetlenir?
Değer yükleme: Modelin “iyi” ya da “kötü” eylem üretmemesi için değerleri kim belirleyecek? LLM için iyi veya kötü nedir?
AGI'ın sınırı teknik değil, felsefidir. Bilgi bir yere kadar iş görüyor, sonrası tuhaf yerlere çıkan bir konu bu.
13. Modelin İç Yapısını Yorumlama
Günümüzde LLM’ler milyonlarca parametreyi optimize ederek yanıt üretir. Ancak bu parametrelerin ne anlama geldiği, neyi temsil ettiği, ya da bir düşünceye karşılık gelip gelmediği hala bir soru işareti.
Ana Sorular:
LLM'ler “bilgi” üretir mi, yoksa sadece “istatistiksel yanıtlar” mı verir?
Bir modelin içinde kavramlar “doğal olarak” oluşur mu, yoksa dışarıdan mı dayatılır? Bunu LLM kendi kendine özgün bir şey keşfedebilir mi gibi düşünebilirsiniz.
Parametre kümeleri arasında anlam kümeleri var mı?
Teknik Yaklaşımlar:
Feature Attribution (Integrated Gradients, SHAP): Modelin kararında hangi girişlerin ne kadar etkisi var?
Mechanistic Interpretability: Belirli bir nöronun temsil ettiği yapı nedir?
Monosemantic Neuron Discovery: Tek bir anlamı temsil eden nöronlar izole edilebilir mi?
Bu konuları araştırmak size kalmış artık. Sadece bir yol haritası oluşturabilmesi adına örneklemlerle birlikte ekliyorum.
Günümüzde LLM’ler milyonlarca parametreyi optimize ederek yanıt üretir. Ancak bu parametrelerin ne anlama geldiği, neyi temsil ettiği, ya da bir düşünceye karşılık gelip gelmediği hala bir soru işareti.
Ana Sorular:
LLM'ler “bilgi” üretir mi, yoksa sadece “istatistiksel yanıtlar” mı verir?
Bir modelin içinde kavramlar “doğal olarak” oluşur mu, yoksa dışarıdan mı dayatılır? Bunu LLM kendi kendine özgün bir şey keşfedebilir mi gibi düşünebilirsiniz.
Parametre kümeleri arasında anlam kümeleri var mı?
Teknik Yaklaşımlar:
Feature Attribution (Integrated Gradients, SHAP): Modelin kararında hangi girişlerin ne kadar etkisi var?
Mechanistic Interpretability: Belirli bir nöronun temsil ettiği yapı nedir?
Monosemantic Neuron Discovery: Tek bir anlamı temsil eden nöronlar izole edilebilir mi?
Bu konuları araştırmak size kalmış artık. Sadece bir yol haritası oluşturabilmesi adına örneklemlerle birlikte ekliyorum.
14. Kendi Kendine Öğrenen Sistemler
Bugüne kadar incelediğimiz her şey, dış veriye bağımlı sistemlerdi. Ancak yapay zekanın evriminde sıradaki büyük adım, otonom gelişme olacak.
Kavramlar:
Self-Supervised Learning: Etiketli veriye gerek kalmadan, verinin kendisinden yapılar çıkarma
World Models (Dünya Modelleri): Ortam simülasyonlarını kendi içinde oluşturabilen sistemler (şu an openai ve tesla bu konuda çılgın yatırımlar yapıyor)
Latent Space Reasoning: Açık veriyle değil, gizli temsillerle akıl yürütme
Araçlar:
DreamerV3, MuZero, DeepMind's Gato
Recurrent Memory Systems (RWKV, RETRO)
VQVAE, Diffusion gibi sistemler
Modelin dış dünya yerine “kendi içindeki bir dünya”da düşünmesi, teknik olarak evrimsel bir adım ve şu an labların en çok kafa yorduğu konu.
Bugüne kadar incelediğimiz her şey, dış veriye bağımlı sistemlerdi. Ancak yapay zekanın evriminde sıradaki büyük adım, otonom gelişme olacak.
Kavramlar:
Self-Supervised Learning: Etiketli veriye gerek kalmadan, verinin kendisinden yapılar çıkarma
World Models (Dünya Modelleri): Ortam simülasyonlarını kendi içinde oluşturabilen sistemler (şu an openai ve tesla bu konuda çılgın yatırımlar yapıyor)
Latent Space Reasoning: Açık veriyle değil, gizli temsillerle akıl yürütme
Araçlar:
DreamerV3, MuZero, DeepMind's Gato
Recurrent Memory Systems (RWKV, RETRO)
VQVAE, Diffusion gibi sistemler
Modelin dış dünya yerine “kendi içindeki bir dünya”da düşünmesi, teknik olarak evrimsel bir adım ve şu an labların en çok kafa yorduğu konu.
15. Ontolojik Riskler
Bir noktada yapay zeka üzerine çalışmak, artık sadece mühendislik değil, ontoloji meselesi gibi bir şey.
Tartışma Alanları:
Intentionality (Niyetlilik): Bir modelin amacı olabilir mi? Yoksa bu sadece bir illüzyon mu?
Değersel Yükleme (Value Alignment): Modelin çıkarımları ile insan değerleri nasıl uyumlanır?
Doğrulama Sorunu: “Doğru bilgi” nedir? Modelin epistemik güvencesi var mı?
Simülasyon ve Gerçeklik: Simüle edilmiş zihin gerçek zihin olabilir mi?
Öncü Yaklaşımlar:
Stuart Russell’ın “provable benefit to humans” prensibi
Christiano’nun Inverse Reinforcement Learning yaklaşımları
Gödel teoremlerine dayalı bilinç sınırları
Yapay zekayı sınırlayan şey bilgi değil, bilginin ne olduğu hakkında anlaşamıyor oluşumuz diyebiliriz. Bu konuda aslında Battlestar Galactica izlemenizi önerebilirim.
Bir noktada yapay zeka üzerine çalışmak, artık sadece mühendislik değil, ontoloji meselesi gibi bir şey.
Tartışma Alanları:
Intentionality (Niyetlilik): Bir modelin amacı olabilir mi? Yoksa bu sadece bir illüzyon mu?
Değersel Yükleme (Value Alignment): Modelin çıkarımları ile insan değerleri nasıl uyumlanır?
Doğrulama Sorunu: “Doğru bilgi” nedir? Modelin epistemik güvencesi var mı?
Simülasyon ve Gerçeklik: Simüle edilmiş zihin gerçek zihin olabilir mi?
Öncü Yaklaşımlar:
Stuart Russell’ın “provable benefit to humans” prensibi
Christiano’nun Inverse Reinforcement Learning yaklaşımları
Gödel teoremlerine dayalı bilinç sınırları
Yapay zekayı sınırlayan şey bilgi değil, bilginin ne olduğu hakkında anlaşamıyor oluşumuz diyebiliriz. Bu konuda aslında Battlestar Galactica izlemenizi önerebilirim.
16. Son Tavsiyeler
Teknik geçmişiniz olmasa bile anlamaya çalışın. Yapay zeka bir kod meselesi değil, bir düşünce problemidir.
Soru sormayı bilen herkes bu alana katkı verebilir.
Yüzeysel API çağrılarıyla yetinmeyin.
Modellerin iç işleyişini, veri akışını, token düzeyindeki davranışlarını anlamaya çalışın.
Düşünce mimarisi kurun.
Prompt mühendisliğini bir yazılım sanatı olarak görün. Her çıktının altında bir bağlam, her bağlamın altında bir varsayım vardır. Klasör mimarinizde sadece promptlar içeren sabit yapılar inşa edin.
Agent sistemleri kurun.
LLM’leri birbirine bağlayarak zincirli ve amaca yönelik görev sistemleri tasarlayın. Bu alan hızla büyüyor ve sizin burada yeriniz var.
Kavramları sözcük olarak değil, yapı olarak öğrenin.
“Transformer nedir?” diye sormak yerine “Neden bu yapıya ihtiyaç duyduk?” diye sorun.
Tartışın. Karşı çıkın. Kendi fikirlerinizi oluşturun.
Yapay zekada hala çok şey belirsiz. En iyi fikirler bazen teknik makaleden değil, meraklı bir zihinden çıkar.
Teknik geçmişiniz olmasa bile anlamaya çalışın. Yapay zeka bir kod meselesi değil, bir düşünce problemidir.
Soru sormayı bilen herkes bu alana katkı verebilir.
Yüzeysel API çağrılarıyla yetinmeyin.
Modellerin iç işleyişini, veri akışını, token düzeyindeki davranışlarını anlamaya çalışın.
Düşünce mimarisi kurun.
Prompt mühendisliğini bir yazılım sanatı olarak görün. Her çıktının altında bir bağlam, her bağlamın altında bir varsayım vardır. Klasör mimarinizde sadece promptlar içeren sabit yapılar inşa edin.
Agent sistemleri kurun.
LLM’leri birbirine bağlayarak zincirli ve amaca yönelik görev sistemleri tasarlayın. Bu alan hızla büyüyor ve sizin burada yeriniz var.
Kavramları sözcük olarak değil, yapı olarak öğrenin.
“Transformer nedir?” diye sormak yerine “Neden bu yapıya ihtiyaç duyduk?” diye sorun.
Tartışın. Karşı çıkın. Kendi fikirlerinizi oluşturun.
Yapay zekada hala çok şey belirsiz. En iyi fikirler bazen teknik makaleden değil, meraklı bir zihinden çıkar.
17. Ve Gelecek
Yapay zeka çok yakında sadece yazı yazan, soru cevaplayan bir sistem olmaktan çıkacak.
Hedef belirleyen, strateji geliştiren, belki de başka yapay zekaları yöneten sistemler göreceğiz. Zaten görmeye başladık ama bunlar artık çok yaygın ve tam performanslı olacak.
Ve o sistemleri yazan, kuran, anlayan insanlar arasında olmak istiyorsananız da sadece öğrenen değil, düşünen biri olmalısınız.
Yapay zeka çok yakında sadece yazı yazan, soru cevaplayan bir sistem olmaktan çıkacak.
Hedef belirleyen, strateji geliştiren, belki de başka yapay zekaları yöneten sistemler göreceğiz. Zaten görmeye başladık ama bunlar artık çok yaygın ve tam performanslı olacak.
Ve o sistemleri yazan, kuran, anlayan insanlar arasında olmak istiyorsananız da sadece öğrenen değil, düşünen biri olmalısınız.
Buna benzer bir içeriği en son 2023'de yazmıştım. Sanırım hala daha paylaşılması gereken bir konu, bu konuda yazmaya devam edeceğim.
Henüz katılmadıysanız, bu tür içerikler için Türkiye'nin en büyük yapay zeka topluluğuna katılmayı unutmayın.
x.com/i/communities/…
Henüz katılmadıysanız, bu tür içerikler için Türkiye'nin en büyük yapay zeka topluluğuna katılmayı unutmayın.
x.com/i/communities/…
Generated by Thread Navigator
Press ⌘ + S to quick-export
