Yanıt Kredisi Nedir?

Jetlink Agentic AI Platformu’nda yanıt üretimi, çeşitli teknik parametrelere göre çalışır ve bu süreçlerin yönetimi yanıt kredisi sistemi üzerinden gerçekleştirilir.
Yanıt kredisi, AI modeline yapılan her isteğin tükettiği kaynak birimini temsil eder. Platformda gerçekleştirilen her bir AI çağrısı, kullanılan özelliklere ve senaryonun karmaşıklığına bağlı olarak bir veya daha fazla kredi harcayabilir.

Yanıt kredisi tüketimini etkileyen başlıca faktörler şunlardır:
  • Yanıtın Input Büyüklüğü
  • Yanıtın Output Büyüklüğü
  • Çok Aşamalı Yanıt Üretimi (Tool Calling ile)
  • Yanıt Büyüklüğü

Yanıt Input Büyüklüğü
Jetlink sisteminde üretilen her yanıt, belirli bir bilgi (input) kapasitesiyle sınırlıdır. Ancak bazı senaryolarda daha fazla bağlamsal bilgi gerekebilir. Bu durumlar için aşağıdaki alternatif modeller kullanılabilir:

Model Tipi
Açıklama
Standart Input
Temel bilgi kapasitesiyle yanıt üretimi sağlar.
Input Token Plus
Standartın 2 katı veriyle yanıt üretimi sağlar.
Input Token Super
Standartın 3 katı veriyle daha kapsamlı yanıt üretir.
Bu opsiyonlar sayesinde, daha fazla bilgiye dayalı daha anlamlı ve derinlemesine yanıtlar elde edilebilir.

Çok Aşamalı Yanıt Üretimi

Bazı senaryolarda, AI modeli tek bir yanıt üretmeden önce harici sistemlerden bilgi çekmek zorundadır. Bu işlem tool calling olarak adlandırılır ve çok aşamalı çalışır:
  1. İlk istek, bir eylemi (örneğin: takvimden uygun saatleri çekmek) tetikler.
  2. İkinci istek, bu verilerle kullanıcıya gösterilecek yanıtı oluşturur.

Her bir aşama ayrı bir AI çağrısıdır ve ayrı ayrı yanıt kredisi tüketir.

Yanıt Büyüklüğü

Üretilen her yanıt ortalama olarak 800 karakter civarındadır. Ancak bazı yanıtlar daha geniş bilgi içerebilir. Bu durumda sistem aynı kullanıcı sorusu için birden fazla yanıt üretir ve her yanıt ayrı yanıt kredisi olarak sayılır.

Not: Kullanıcıya gösterilen yanıt tek bir mesaj gibi görünebilir ancak arka planda birden fazla yanıt üretimi gerçekleşmiş olabilir.

Örnek Senaryo: Randevu Oluşturma
Bir kullanıcı, “Yarın sabah bir demo toplantısı ayarlayabilir miyim?” şeklinde bir soru sorduğunda, aşağıdaki süreç devreye girer:

Aşama 1: Agent, takvim servisine erişerek uygun zaman aralıklarını kontrol eder.

→ 1 yanıt kredisi kullanılır.

Aşama 2: Bu bilgiye dayanarak, model kullanıcıya “Yarın sabah 10:00 ve 11:30 arası uygun. Hangisi tercih edersiniz?” gibi bir mesaj oluşturur.

→ 1 yanıt kredisi daha kullanılır.

Bu işlem toplamda 2 ayrı model çağrısı gerektirdiği için 2 yanıt kredisi tüketilmiş olur.