Visualize Thread by @hrrcnes | Thread Navigator

✨ Visual Editor

Thread Truncated

Only the first 20 tweets are shown to ensure high-quality rendering and prevent image size issues.

palette Canvas & Background

Presets

Custom Colors

Gradient:arrow_forward

Text Color:

Gradient Angle135°

Background Pattern

Grain Texture

Aspect Ratio

style Card Style

Preset

Padding40px

Card Radius16px

Enable Card Shadow

Glassmorphism Effect

Show Watermark AGENCY

Show Timestamps

Show X Logo

text_fields Typography

Font Family

Font Size16px

hurri

@hrrcnes

yapay zekada nasıl ustalaşılır (tam yol haritası):

hurri

@hrrcnes

Çoğu kişi yapay zekayı yanlış yerden öğrenmeye başlıyor. Model eğitmeye çalışıyor ama vektör nedir bilmiyor. Chatbot geliştiriyor ama dil modellerinin temellerine hakim değil.

9. maddeye kadar temel kavramlar üzerinde duracağız, sonrasında da ileri düzeye geçeceğiz.

Kısacası bu rehber, eksiksiz bir kavrayışla sıfırdan ileri düzeye ulaşmanız için tasarlandı.

Kimler için uygun derseniz de, hiçbir teknik altyapısı olmayanlar, kodlama bilgisi olup AI dünyasına adım atmak isteyenler, kendi ürününü geliştirmek isteyen girişimciler veya “neden çalıştığını” anlamadan sadece “nasıl çalıştığını” bilen herkes için diyebiliriz.

hurri

@hrrcnes

1. Yapay Zekanın Temelleri

Başlamadan önce terminolojiyi oturtun. Kavramları netleştirmek karmaşayı ortadan kaldırır.

Yapay Zeka (AI): İnsan zekâsını taklit eden sistemler
Makine Öğrenmesi (ML): Kurallar yazılmadan, veriden öğrenen sistemler
Derin Öğrenme (DL): Sinir ağlarıyla çok katmanlı öğrenmeyi mümkün kılan ML alt dalı
Doğal Dil İşleme (NLP): Dili anlamaya ve üretmeye odaklı yapay zeka dalı

Bu farkları özümsemeden ileriye geçmek, temel yapı taşları eksik bir bina inşa etmek gibi bir şey olur, o nedenle burada anlamadıysanız bile atın GPT'ye bu tweeti, açıkla kardeşim diyin.

hurri

@hrrcnes

2. Dil Modellerinin Anatomisi

Bütün modern yapay zeka uygulamaları bir dile dayanır.
Ama o dil, insan dili değil, token dilidir.

Büyük Dil Modelleri (LLM): Milyarlarca kelimeyle eğitilen, bir sonraki kelimeyi tahmin eden modeller

Transformer Mimarisi: Bugünkü dil modellerinin temel taşıdır (GPT, BERT, Claude vs.)

Token Kavramı: AI için kelimeler değil, token’lar vardır. 1 token yaklaşık olarak 4 karaktere denk gelir.

"Merhaba" = 2 token
"Yapay zeka" = 3 token gibi düşünebilirsiniz.

Bağlam Penceresi (Context Window): Modelin “hatırlayabileceği” maksimum token sayısıdır

GPT-4: 128K
Claude 3 Opus: 200K+

Token yönetimi, sadece maliyeti değil, performansı da doğrudan etkiler.

hurri

@hrrcnes

3. Parametreler ve Ayarların Anlam

LLM'ler davranışlarını ayarlayabileceğiniz mekanizmalar sunar.

Temperature: Rastlantısallık düzeyini belirler

0.0: Aynı giriş = Aynı çıktı
0.7: Dengeli, doğal cevaplar
1.5+: Kaotik, bazen yaratıcı bazen anlamsız

Hatta en basit düzeyde LLM ile iletişime geçerken prompt içerisinde bile bu parametreyi ayarlamasını söylerseniz farkı görebilirsiniz.

Top-p (Nucleus Sampling): Modelin yanıt aralığını sınırlar

Frequenzy Penalty & Presence Penalty: Tekrarlayan veya benzer kelimelerin kullanımını azaltmak için kullanılır

Basit mantıkla düşünün, doğru ayar doğru davranış demektir. LLM’leri ustaca kullanmak istiyorsanız bu ayarları öğrenmelisiniz.

hurri

@hrrcnes

4. Prompt Mühendisliği

LLM'lerin performansı, verdiğiniz promptun kalitesine bağlıdır.

Kötü bir prompt, en gelişmiş modeli bile işe yaramaz hale getirir.

Rol tanımı: "Sen bir editörsün…" gibi başlangıçlar modele bağlam kazandırır

Örnekleme: İstediğiniz çıktının örneğini verin

Zincirleme prompt: Karmaşık sorunları aşamalandırarak çözdürün

Format kontrolü: JSON, tablo, madde listesi gibi açık biçimler talep edin

Prompt mühendisliği, yazılım mühendisliğinin yeni dili olacak. Bunu ben değil, elon musk gibi, naval gibi, ilya gibi insanlar söylüyor. O nedenle ciddiye alsanız iyi olur, 110 IQ türk twitter yazılımcısının prompt mühendisliği hakkındaki söylemlerini pek umursamayın.

hurri

@hrrcnes

5. Embedding

Modeller sadece kelimeleri değil, anlamları temsil eder.

Embedding: Bir kelimenin/anlamın çok boyutlu vektörler halinde temsil edilmesidir. Benim nazarımda AI alanındaki en keyifli ve işlevsel konulardan birisidir

Kullanım alanları: Arama motorları, öneri sistemleri, semantik analiz

Yalnız dikkat edilmesi gereken önemli nokta şu ki aynı anlama gelen cümlelerin embedding vektörleri birbirine yakın olur. Klasik veri işlemektense anlam bazlı veri işleme olarak düşünebilirsiniz. Çok fazla kapı açar kapatır.

Kısacası embedding, veriyi kelime yerine “anlam” düzeyinde işlemenizi sağlar.

hurri

@hrrcnes

6. Uygulama Zamanı: API’lerle Model Kullanımı

Modeli anlamak kadar onu programlı bir biçimde kullanmak da önemlidir.

OpenAI, Anthropic, Cohere, Mistral, Google gibi API sağlayıcıları

Python ile API entegrasyonu

Yanıt yönetimi, gecikme optimizasyonu, hataya karşı savunmalar

Otomatik görev sistemleri (agent sistemleri)

Teoriyi pratiğe dönüştürmeden uzmanlık olmaz. O nedenle eğer geliştirme kısmına merak salıyorsanız en azından bunun arkasında yatan mantığı kavrayın.

hurri

@hrrcnes

7. Fine-tune ve Kendi Modellerinizi Eğitme

Bu aşama ileri düzeydir. Ama kavrayışınız güçlendikçe buna hazır olacaksınız.

Fine-tuning: Mevcut bir modeli özel bir veri setiyle yeniden eğitmek

LoRA / QLoRA: Hafifletilmiş ve maliyeti düşüren fine-tuning yöntemleri

Dataset hazırlama: Kaliteli veri her şeyin temelidir, modelleri eğiteceğiniz veri seti bu da.

Sadece büyük veri değil, doğru yapılandırılmış veri gereklidir. Yani yüzbinlerce gigabytlık çöp veri yerine yüz bin katı daha ufak ama iyi odaklı veri daha iyi sonuç almanızı sağlar.

hurri

@hrrcnes

8. Çok Modlu Sistemler ve Gelecek Perspektifi

Sadece metin değil, ses, görsel, video gibi çoklu veri kaynakları da yapay zekanın bir parçası.

Görsel + Metin Modelleri: GPT-4V, Gemini, Claude 3

Sesli Asistanlar: Whisper, Voice AI, ElevenLabs

Otonom Agentlar: Görev tabanlı, planlama yapabilen yapay zekalar, mesela Manus

Simülasyon ortamları ve dünya modelleri: Modelin kendi başına “düşünebilmesi” için gerekli bileşenler. Mesela Stanford Westworld deneyi.

Sadece yazılı komutlarla çalışan yapay zekaların devri kısa süre içinde kapanacak, çok boyutlu veriyle çalışan yapay zekalara yöneliyoruz.

hurri

@hrrcnes

9. Agent Sistemleri ve Otonomi

Buraya kadar öğrendiğin her şey bir temeldi. Şimdi bu temelin üzerine sistem kurmayı öğreniyorsun. Agentlar, birden fazla adımı planlayıp kendi başlarına yürütme kapasitesine sahip yapay zeka birimleridir.

Sadece cevap üretmezler, görev alır, plan yapar, duruma göre yön değiştirirler.

Ana Bileşenler:
Planlayıcı (Planner): Hedefi parçalara ayırır
Bellek (Memory): Kısa ve uzun vadeli bilgileri tutar
Yürütücü (Executor): Alt görevleri yerine getirir
Refleksiyon (Reflection): Kendi kararlarını değerlendirip tekrar plan yapar

Araçlar:

LangGraph / AutoGPT / CrewAI / Manus
Pinecone / Weaviate ile vektör belleği
Arama motoru + API entegreli agent zincirleri

Amaç modelleri pasif cevaplayıcıdan çıkarıp, aktif problem çözücülere dönüştürmek.

hurri

@hrrcnes

10. Yapay Zeka ve Anlama

Bir modelin “anlaması” demek, aslında onun olasılıkları dağıtabilmesi demektir. LLM’ler, temelinde bilgi kuramına dayanır: Entropi, sürpriz, olasılık, sembolik yoğunluk.

Kavramlar:
Enformasyon Teorisi: Claude Shannon’ın izinden, bir mesajın belirsizliğini ölçmek
Minimum Description Length: İyi modellerin veriyi sıkıştırabilme yeteneği
Bayes Kuralı: İnanç güncellemesi. LLM’lerin ön kabul + bağlam temeli
Kolmogorov Karmaşıklığı: Bir yapının açıklanabilirliği, sıkıştırılabilirliği

LLM bu noktada üzerindeki "yapay" ibaresini atar ve gerçek “zeka” burada başlar. Çünkü zeka, olasılık dağılımı tahminiyle başlar.

hurri

@hrrcnes

11. Model Mimarilerinin Evrimi ve Donanım Gereksinimleri

Bugün bir modeli nasıl kullandığımız kadar, nasıl eğittiğimiz de önemlidir.

Mimariler:
Transformer (2017–2023): Tüm dikkati yöneten mimari
Mixture-of-Experts (MoE): Her göreve özel nöronları aktifleştiren sistemler (google bard, qwen)
Sparse Attention/Linear Transformers: Bellek ve hız optimizasyonları
Retrieval-Augmented Generation (RAG): Modelin dış veri kaynaklarını çağırabilmesi (langchain)

Donanım:
GPU mimarileri (A100, H100, MI300): yapay zekanın motorudur.
Lokalde çalıştırmak için gerekli VRAM hesaplama: (model boyutu x quant boyutu/8)x1.2
TPU, LPU ve özel ASIC'ler: Model türüne göre donanım seçimi
Model quantization ve pruning: Hafifletme teknikleriyle devasa modelleri edge cihazlarda çalıştırma

Kod bilgisi sizi bir noktaya getirir, mimari bilgisi ise sınıf atlatır. O nedenle önemli. Daha fazla bilgi edinmek istiyorsanız redditte r/ollama 'ya katılın, biraz okuyun bu konuda ne kadar kafa yakmış adam varsa orada.

hurri

@hrrcnes

12. AGI ve Etik Sınırlar

Yapay zekayı sadece bir araç olarak görmek, onu eksik anlamaktır. Bir noktadan sonra, neyin mümkün olduğu değil, neyin yapılabilir olduğu sorusu sorulur ki o soru sorulduğunda da bir ton alt soru ortaya çıkar.

Tartışmalar:
AGI tanımı: Yalnızca dil mi, yoksa soyutlama, planlama ve niyet mi? AGI gerçekten nedir sorusuna 500 farklı yanıt alırsınız, Grok4 AGI mı sorusunun nedeni de bu.

İçsel bilinç sorunu: LLM'ler bilince yakın mı? Yoksa bir yanılsama mı yaratıyorlar?

Kontrol problemleri: Kendi görevlerini belirleyebilen bir model nasıl denetlenir?

Değer yükleme: Modelin “iyi” ya da “kötü” eylem üretmemesi için değerleri kim belirleyecek? LLM için iyi veya kötü nedir?

AGI'ın sınırı teknik değil, felsefidir. Bilgi bir yere kadar iş görüyor, sonrası tuhaf yerlere çıkan bir konu bu.

hurri

@hrrcnes

13. Modelin İç Yapısını Yorumlama

Günümüzde LLM’ler milyonlarca parametreyi optimize ederek yanıt üretir. Ancak bu parametrelerin ne anlama geldiği, neyi temsil ettiği, ya da bir düşünceye karşılık gelip gelmediği hala bir soru işareti.

Ana Sorular:

LLM'ler “bilgi” üretir mi, yoksa sadece “istatistiksel yanıtlar” mı verir?
Bir modelin içinde kavramlar “doğal olarak” oluşur mu, yoksa dışarıdan mı dayatılır? Bunu LLM kendi kendine özgün bir şey keşfedebilir mi gibi düşünebilirsiniz.
Parametre kümeleri arasında anlam kümeleri var mı?

Teknik Yaklaşımlar:

Feature Attribution (Integrated Gradients, SHAP): Modelin kararında hangi girişlerin ne kadar etkisi var?
Mechanistic Interpretability: Belirli bir nöronun temsil ettiği yapı nedir?
Monosemantic Neuron Discovery: Tek bir anlamı temsil eden nöronlar izole edilebilir mi?

Bu konuları araştırmak size kalmış artık. Sadece bir yol haritası oluşturabilmesi adına örneklemlerle birlikte ekliyorum.

hurri

@hrrcnes

14. Kendi Kendine Öğrenen Sistemler

Bugüne kadar incelediğimiz her şey, dış veriye bağımlı sistemlerdi. Ancak yapay zekanın evriminde sıradaki büyük adım, otonom gelişme olacak.

Kavramlar:
Self-Supervised Learning: Etiketli veriye gerek kalmadan, verinin kendisinden yapılar çıkarma

World Models (Dünya Modelleri): Ortam simülasyonlarını kendi içinde oluşturabilen sistemler (şu an openai ve tesla bu konuda çılgın yatırımlar yapıyor)

Latent Space Reasoning: Açık veriyle değil, gizli temsillerle akıl yürütme

Araçlar:

DreamerV3, MuZero, DeepMind's Gato
Recurrent Memory Systems (RWKV, RETRO)
VQVAE, Diffusion gibi sistemler

Modelin dış dünya yerine “kendi içindeki bir dünya”da düşünmesi, teknik olarak evrimsel bir adım ve şu an labların en çok kafa yorduğu konu.

hurri

@hrrcnes

15. Ontolojik Riskler

Bir noktada yapay zeka üzerine çalışmak, artık sadece mühendislik değil, ontoloji meselesi gibi bir şey.

Tartışma Alanları:

Intentionality (Niyetlilik): Bir modelin amacı olabilir mi? Yoksa bu sadece bir illüzyon mu?

Değersel Yükleme (Value Alignment): Modelin çıkarımları ile insan değerleri nasıl uyumlanır?

Doğrulama Sorunu: “Doğru bilgi” nedir? Modelin epistemik güvencesi var mı?

Simülasyon ve Gerçeklik: Simüle edilmiş zihin gerçek zihin olabilir mi?

Öncü Yaklaşımlar:

Stuart Russell’ın “provable benefit to humans” prensibi
Christiano’nun Inverse Reinforcement Learning yaklaşımları

Gödel teoremlerine dayalı bilinç sınırları

Yapay zekayı sınırlayan şey bilgi değil, bilginin ne olduğu hakkında anlaşamıyor oluşumuz diyebiliriz. Bu konuda aslında Battlestar Galactica izlemenizi önerebilirim.

hurri

@hrrcnes

16. Son Tavsiyeler

Teknik geçmişiniz olmasa bile anlamaya çalışın. Yapay zeka bir kod meselesi değil, bir düşünce problemidir.

Soru sormayı bilen herkes bu alana katkı verebilir.

Yüzeysel API çağrılarıyla yetinmeyin.

Modellerin iç işleyişini, veri akışını, token düzeyindeki davranışlarını anlamaya çalışın.

Düşünce mimarisi kurun.

Prompt mühendisliğini bir yazılım sanatı olarak görün. Her çıktının altında bir bağlam, her bağlamın altında bir varsayım vardır. Klasör mimarinizde sadece promptlar içeren sabit yapılar inşa edin.

Agent sistemleri kurun.
LLM’leri birbirine bağlayarak zincirli ve amaca yönelik görev sistemleri tasarlayın. Bu alan hızla büyüyor ve sizin burada yeriniz var.

Kavramları sözcük olarak değil, yapı olarak öğrenin.

“Transformer nedir?” diye sormak yerine “Neden bu yapıya ihtiyaç duyduk?” diye sorun.

Tartışın. Karşı çıkın. Kendi fikirlerinizi oluşturun.
Yapay zekada hala çok şey belirsiz. En iyi fikirler bazen teknik makaleden değil, meraklı bir zihinden çıkar.

hurri

@hrrcnes

17. Ve Gelecek

Yapay zeka çok yakında sadece yazı yazan, soru cevaplayan bir sistem olmaktan çıkacak.

Hedef belirleyen, strateji geliştiren, belki de başka yapay zekaları yöneten sistemler göreceğiz. Zaten görmeye başladık ama bunlar artık çok yaygın ve tam performanslı olacak.

Ve o sistemleri yazan, kuran, anlayan insanlar arasında olmak istiyorsananız da sadece öğrenen değil, düşünen biri olmalısınız.

hurri

@hrrcnes

Buna benzer bir içeriği en son 2023'de yazmıştım. Sanırım hala daha paylaşılması gereken bir konu, bu konuda yazmaya devam edeceğim.

Henüz katılmadıysanız, bu tür içerikler için Türkiye'nin en büyük yapay zeka topluluğuna katılmayı unutmayın.

x.com/i/communities/…

Generated by Thread Navigator

100%

view_carousel Carousel Studio NEW

Press ⌘ + S to quick-export