Prediksi Bola Indonesia
    Kembali ke Beranda
    Metodologi

    Metodologi Prediksi & Analisis

    Bagaimana model AI, data sumber, dan logika editorial vcad.site bekerja secara end-to-end.

    Terakhir diperbarui: 11 Mei 2026

    Halaman ini menjelaskan bagaimana vcad.site menghasilkan prediksi, statistik, dan analisis pertandingan. Kami percaya pembaca berhak tahu dari mana angka berasal dan bagaimana model kami bekerja, sehingga setiap kesimpulan dapat dievaluasi secara kritis.

    Pipeline kami dibagi menjadi empat tahap: pengumpulan data, normalisasi, perhitungan probabilitas, dan generasi konten editorial. Seluruh proses berjalan otomatis melalui cron job harian antara pukul 13:00 dan 15:30 WIB.

    01Sumber data

    • Football-Data.org — jadwal, hasil, klasemen, dan metadata kompetisi untuk liga-liga top Eropa serta turnamen UEFA dan FIFA.
    • The Odds API — odds pasar dari multiple bookmaker untuk perhitungan probabilitas implisit dan deteksi value.
    • API-Sports media — logo resmi tim, liga, dan stadion (digunakan hanya sebagai aset visual referensi).
    • Data klasemen tambahan disinkronkan dari sumber resmi liga ketika tersedia.

    02Normalisasi dan rekonsiliasi

    Nama tim dari sumber yang berbeda sering tidak konsisten (misalnya "Man City" vs "Manchester City FC"). Kami menjalankan algoritma fuzzy matching: menghilangkan aksen, sufiks korporat (FC, AC, CF), dan karakter non-alfanumerik, lalu mencocokkan dengan ID tim kanonik di basis data kami. Setiap referensi yang gagal dicocokkan ditandai untuk peninjauan manual.

    03Model probabilitas dan xG

    Untuk setiap pertandingan mendatang, kami memanggil Google Gemini 2.5 Flash Lite dengan prompt terstruktur yang berisi konteks: form lima pertandingan terakhir kedua tim, posisi klasemen, statistik gol, head-to-head historis, dan odds pasar terkini. Model mengembalikan output JSON berisi probabilitas menang–seri–kalah, expected goals untuk setiap tim, dan probabilitas Over/Under serta BTTS.

    Probabilitas dikalibrasi terhadap odds pasar untuk mendeteksi value: jika probabilitas model lebih tinggi dari probabilitas implisit pasar dengan margin lebih dari 3%, pertandingan ditandai sebagai Value Bet. Pertandingan dengan tingkat keyakinan model ≥ 78% dan probabilitas menang ≥ 60% ditandai sebagai Banker Pick.

    04Generasi analisis editorial

    Analisis tertulis sepanjang 1500+ kata digenerasi terpisah menggunakan Google Gemini 2.5 Flash, model yang lebih kuat untuk teks panjang. Output mencakup info cedera per tim, ringkasan pertemuan terakhir, kondisi skuad dan taktik, faktor kunci, rekomendasi Asian Handicap dan Over/Under, serta kesimpulan. Output dikembalikan dalam format JSON murni dan disimpan di basis data agar pembaca tidak perlu menunggu generasi ulang.

    Untuk hasil pertandingan, kami menggenerasi laporan jurnalistik sepanjang sekitar 1000 kata yang fokus pada jalannya pertandingan, momen kunci, performa pemain, dan implikasi terhadap klasemen. Kami sengaja tidak mengevaluasi akurasi prediksi pra-pertandingan untuk menjaga laporan tetap netral.

    05Keterbatasan dan disclaimer model

    Model probabilistik tidak pernah 100% akurat. Cedera mendadak, keputusan wasit, kondisi cuaca, dan faktor non-statistik lainnya dapat mengubah hasil. Angka yang kami sajikan adalah estimasi berbasis data historis, bukan ramalan pasti.

    Kami tidak merekomendasikan penggunaan output model untuk keputusan finansial, termasuk taruhan. Konten ini ditujukan untuk tujuan informasi olahraga dan diskusi analitis.

    06Pembaruan dan versi model

    Saat ini kami menggunakan google/gemini-2.5-flash-lite untuk batch generasi prediksi dan google/gemini-2.5-flash untuk teks panjang. Pemilihan model dapat berubah seiring rilis model baru; perubahan signifikan akan dicatat di halaman ini.