• 88
    acikcasi daha once bu baslikta xg'nin ne oldugunu ve olmadigini anlatmaya calismis biri olarak (bkz: xg/#3238268) su anda alayci elestiri getiren arkadaslarin buyuk oranda hakli oldugunu dusunuyorum. istatistik dersi alanlarin muhtemelen duymus oldugu, survivorship bias diye bir kavram vardir. bu kavramin en bilinen ornegi savas ucaklariyla ilgilidir. 2. dunya savasi sirasinda ucaklarini kuvvetlendirmek isteyen abd, savastan geri donen ucaklarin hasar datasini toplayip bu veri uzerinden en cok hasar alan noktalari guclendirmeyi planliyor. dataya bakildiginda ilk basta motor ve kokpitin cok az hasar aldigi, dolayisiyla bu alanlarin guclendirilmesine gerek olmadigi sonucuna variyorlar. ancak burada kritik nokta datanin savastan geri donen ucaklardan toplanmis olmasi. motoru veya kokpiti hasar alan ucaklar savastan geri donemiyorlar. dolayisiyla topladiklari data aksini iddia etmesine ragmen, bu datanin yanli bir olcum oldugunu anlayip motor ve kokpit bolgesini guclendirmeye karar veriyorlar.

    simdi bu hikayeyi neden anlattin derseniz, bizde de maalesef istatistik ya da matematik temeli olmayan bircok arkadas xg'ye buyuk anlam yukleyip neredeyse sadece xg uzerinden oynadigimiz oyunu olumlamaya calisiyorlar. ancak bunu yaparken bircogu yapilan olcumu galatasaray'in geride oldugu dakikalar/berabere oldugu dakikalar/onde oldugu dakikalar seklinde ayirmiyor. dolayisiyla ozellikle son donemde maclarin bircok dakikasinda geride ya da berabere olup risk aldigimiz, rakipler de kapandigi icin olcum yanli olmus oluyor. bu yanlilik isin sadece bir yonu, bunun disinda daha once de bu baslikta bahsedilen baska konular var. mesela xg size sadece beklentiyi veriyor, ancak bunun bir de standart sapmasi var. cok basit bir mantikla 40 metreden 30 sut cekmekle, 1 adet penalti atmak arasinda bir fark olmasi gerek, ancak sadece beklentiye baktiginiz zaman ikisi birbirine esit olmus oluyor. bunun disinda sutla sonuclanmayan ataklarin nasil modellenecegi (ki onceki entry'mde tehdit beklentisi kavramindan bahsetmistim), ayni pozisyonda cekilen birden sutun nasil modellenecegi vb konulardaki eksikler/yanlislar vs derken xg'nin size cizdigi tablo gercekteki tablodan cok farkli olabiliyor. bu yuzden de avrupa'da bircok takim ham veriyi direkt olarak teknik ekibin onune vermek yerine veri bilimi/analizi uzmanlarina isletip onlarin isledigi/temizledigi datayi ve analizlerini teknik ekibe veriyor.

    21 aralık 2021 adana demirspor galatasaray maçına bakacak olursak skorun 0-0 gittigi donemde omer bayram'in bir pozisyonu haric pozisyon bulamadik. rakibimiz ise ilk yari boyunca yunus uzerinden surekli sol tarafimizda bosluk yakaladi, ancak ilk yarida bu bosluklari iyi pozisyonlara donusturmekte sikinti yasadilar, dolayisiyla cok fazla xg uretemediler. ikinci yarida ise buraya attiklari bir topla yunusu kaleciyle karsi karsiya birakip golu yakaladilar bu kez. ikinci gol icin ise diyecek fazla bir sey yok, ozguven ve becerinin birlesmesiyle ekstra bir gol atti yunus. bu dakikaya kadar oynanan oyuna bakarsak iki takimin da xg uretemedigi, ancak bir takimin israrla bir plan dogrultusunda hucum ettigi ve sonunda bu planla golu buldugu sonucuna varabiliriz. bu dakikadan sonraysa adana geri cekildi, biz de uzerlerine gittik. birkac pozisyon yakaladik, ancak gol gelmedi. gol gelmedikce bastirmaya ve pozisyon yakalamaya devam ettik, yuksek miktarda xg urettik. burada gol gelmemesinde beceriksizlik kadar baski/stres ve ozguven eksikligini de vurgulamak gerek. mac sonundaki tabloya bakip olumlu olarak bir yorum yaparsak 2-0 geri dustukten sonra iyi mucadele etmis ve geri donmeye calismisiz diyebiliriz. ancak maci sadece o bolumdeki pozisyonlar uzerinden okuyup, "aslinda biz hak ettik ya" demek kendimizi kandirmak oluyor.

    ozet gec derseniz, xg ve benzeri istatistiklersiz kalmayin, ancak sahada gorduklerinizden bagimsiz futbolu sadece bunlar uzerinden de yorumlamayin bence.
  • 60
    tarih: $3,5

    askerliğimi adana'da yaptım. o zamandan kalma amele yanıklarım tecen peyniri gibi tene sahip ben için hâlâ bellidir.

    öğle yemeği içtiması sonrası uygun adım yemekhaneye yollandık. herkeste bir süzülme, mayışma, mıymıntılık. bu lakayıtlıkla ayaklar uygun adım vuramıyor, diller "muhaberecinin bir bakışına" diye gırtlak yırtarak bağıramıyor. neyse malumdur, süründük biraz. tâ yemekhaneye kadar, yolu uzatarak asfaltta. sonunda yemekhaneye vardık.

    o zaman çok beyefendi, ağzında küfür eğreti duran bir tertibim vardı. annesi üniversitede istatistik hocasıydı. babası imamdı. zaten kavrulmuştu hepimiz gibi.

    giresun-ordu civarından olanlar bilir. çifte kavrulmuş fındığın tadı başka olur. asfaltta da bir güzel kavrulunca göğe baktı. yüzündeki teri sanki amin derken yüzü mesh edermiş gibi sildi. dua etmiş mübarek herhalde diye düşünürdünüz. heyhat! beddua ediyormuş. kan ter içinde bir feveranla içten bir sinkaf koyverince anladık:

    "bu güneşin anasını skrm hâ!!!"

    küfür bir insanın ağzına bu kadar yakışmazdı. tabii adamın dili zikre alışkın. biz şaşkın. komutan güldü. termometreyi gösterdi. sadece 30 dereceyi gösteriyordu namussuz!

    termometreyi görünce fısıldadı:
    "nereye 30 derece yrrmmmm! öldük de cehennem'e geldik sanki!? benim ne işim var amk cehennemde. namazında niyazında adamım amk."

    o gün net 50 dereceydi. hiç kimse beni 30'a 40'a falan inandıramaz. don dayanmıyordu don! don hırsızlığı başlamıştı ulan!

    bu xg olayı güzel de... sanki bir şey eksik.

    sıcaklık vs hissedilen sıcaklık gibi...

    tamam. xg hesaplanıyor bir şekilde, yüksek yüksek sayılar falan çıkıyor. müthiş bir olay. bize bazı şeyler anlatıyor, anlamak istiyorsak ve anlamlandırabiliyorsak. ama yahu sahada olanlar hiç öyle hissettirmiyor.

    garip şey.

    neden böyle oluyor acaba? bilen biri varsa hemen entri'nin sağ altındaki "on"a basıp favlamayı unutmasın. mesaj yeşili de güzeldir.

    hakemler kötü bu arada.

    evet.

    cia aravederci.
  • 35
    sezon maç gol ort.
    1959-59 114 264 2,31
    1959-60 380 929 2,44
    1960-61 380 850 2,23
    1961-62 380 857 2,25
    1962-63 352 937 2,66
    1963-64 306 691 2,06
    1964-65 240 516 2,15
    1965-66 240 545 2,27
    1966-67 272 549 2,02
    1967-68 272 602 2,21
    1968-69 240 471 1,96
    1969-70 240 419 1,74
    1970-71 240 445 1,85
    1971-72 240 464 1,93
    1972-73 240 449 1,87
    1973-74 240 405 1,68
    1974-75 240 442 1,84
    1975-76 240 479 1,99
    1976-77 240 442 1,84
    1977-78 240 474 1,97
    1978-79 240 486 2,02
    1979-80 240 422 1,75
    1980-81 240 466 1,94
    1981-82 272 490 1,80
    1982-83 306 636 2,08
    1983-84 306 633 2,06
    1984-85 306 686 2,24
    1985-86 342 808 2,36
    1986-87 342 776 2,26
    1987-88 380 1032 2,71
    1988-89 342 985 2,88
    1989-90 306 819 2,67
    1990-91 240 672 2,80
    1991-92 240 677 2,82
    1992-93 240 716 2,98
    1993-94 240 700 2,91
    1994-95 306 945 3,08
    1995-96 306 873 2,85
    1996-97 306 878 2,86
    1997-98 306 861 2,81
    1998-99 306 875 2,85
    1999-00 306 878 2,86
    2000-01 306 1017 3,32
    2001-02 306 910 2,97
    2002-03 306 853 2,78
    2003-04 306 908 2,96
    2004-05 306 901 2,94
    2005-06 306 849 2,77
    2006-07 306 736 2,40
    2007-08 306 784 2,56
    2008-09 306 787 2,57
    2009-10 276 666 2,41
    2010-11 306 838 2,73
    2011-12 330 860 2,60
    2012-13 306 817 2,66
    2013-14 306 806 2,63
    2014-15 306 873 2,85
    2015-16 306 827 2,70
    2016-17 306 828 2,70
    2017-18 306 906 2,96
    2018-19 306 821 2,68
    2019-20 306 875 2,85
    2020-21 400 1136 2,84 genel ort. 2,46

    bu veriler ligimize ait. diğer liglerde de benzer bir ortalama bulunabilir. ülkelerin futbol anlayışlarına göre bazılarının gol ortalamaları daha yüksek, bazılarının daha düşük olacaktır ama son kertede tüm futbol maçlarının gol ortalamasında bulacağınız sayı, muhtemelen 3'e daha yakın, 2 ve 3 arasında bir sayı olacaktır. (zaten futbol bahis dünyasında en fazla tercih edilen bahsin 2,5 gol alt-üst olmasının istatistiksel nedeni budur.) bu ortalamanın önemi, yazının ilerleyen bölümlerinde ortaya koyulacak sevgili romalılar.

    expg ya da xg, ecnebilerin expected goals adını verdiği çeşitli parametreler kullanılarak oluşturulan ve gol beklentisini gösteren verinin kısaltılmış hali. özellikle teknik direktörlerin kullanması ve gerekli çıkarımları yapması gereken değerli bir veri. ama futbol, bu tür verilerin en az geçerli olduğu takım sporudur. çünkü futbol, doğası gereği, hawking'in uğraştığı ve başaramadığı theory of everything (her şeyin teorisi) gibi bir teori talep eder. şöyle örneklendirelim: kendi sahasında topla buluşan bir orta saha oyuncusu, sağ kanattan fırlayan ve önü açık olan beke pas versin. ve bu pas, açısı, şiddeti, topun havadan ya da yerden gitmesi vs. gibi sebeplerden biri ya da birkaçı yüzünden, hızlanan ve momentumu artan bekin bir adım gerisine düşsün. istatistiklerde bu başarılı bir pas olarak görünecektir. ancak, bir adım gerisine düşen top nedeniyle hızını yavaşlatmak zorunda kalan ve momentumu düşen bek, önü artık kapalı olduğu için topu geriye oynamak zorunda kalacak. maçı izleyen bizler, verilen pas bekin gerisine değil de, bir adım önüne olsa, o çok değerli 2 saniyenin harcanmayacağını ve takımımızın olası bir golden olduğunu görürüz. ve tüm bu olaylar atak yapan takımın kendi yarı sahasında yaşansın. benzer milyonlarca örnek verilebilir. ve bu örneklerin verileri toplanamaz. herhangi bir şut olmadığı için, xg de bunu ölçemez.

    diğer takım sporlarında ortalama goal (yani hedef, skor) sayıları çok yüksek olduğu için, istatistiksel veriler çok daha fazla şey ifade eder. çünkü bir maçta yüzlerce skor ve yine yüzlerce şut pozisyonu olur. söz gelimi, bir basketbolcunun serbest atış çizgisindeki ya da 3 sayılık şut başarı istatistiği net olarak ortadadır. çünkü bir basketbolcunun kariyerinde onbinlerce şut istatistiği vardır ve bir maçta atacağı serbest atış oranı gerçek değerine çok yakın olacak şekilde öngörülebilir. bir parayı 10 kez havaya atın. 8t 2y, 4t 6y, 7t 3y gelebilir. ama örneklem kümesini yükseltirseniz, yani parayı 2000 kez havaya atarsanız, 1000t 1000y sonucuna çok yakın veriler toplarsınız. futboldaki gol ortalama sayısına geri dönelim: 2 ve 3 arası sihirli bir sayı. yani goal, futbolda diğer takım sporlarına göre öldürücü önemde. diğer sporlara nazaran çok nadir (şut ve pozisyon sayısı da) ve oluşması için 20 öncesi pasın kalitesinin bile etkisi diğer takım sporlarına göre çok fazla.

    ayrıca xg aritmetik toplamayla oluşturulan bir veri. hayali bir atletico madrid-real madrid maçı düşünelim. real maç boyu 14 şut çekmiş olsun. bu 14 şutun xg değerleri toplamı 2,3 olsun. ama maçı izleyen bizler atletico'nun maç boyu çok iyi defans yaptığını ve ral'in zorlama şutlar dışında etkili ataklar geliştiremediğini gördük. maç boyu rakip yarı sahada boş alan bulamamış, taraftarlarını heyecanladıracak pozisyonlara girememiş ve maçı 2-0 kaybetmiş bir real madrid. ama xg:2,3!

    inanın futbolun doğasına dair çok daha fazla örnek verilebilir. xg değerli bir veri. tekrar ediyorum, teknik direktörler tarafından üzerinde çalışılması ve değerlendirilmesi önemli. ama futbolun diğer takım sporlarının yanına asla yaklaşamayacağı kadar çok değişkenleri var ve bu ölçüm denemeleri tüm iyi niyetlerine rağmen, eşyanın doğası gereği yetersiz.

    bu konunun son zamanlarda sözlüğümüzde sık dillendirilmesinin sebebinin, fatih terim'i her daim savunma refleksine sahip yazarlar olduğunu düşünüyorum. (bkz: fenerbahçe kırmak üzereyken tanımlanan rekorlar) örneğindeki fenerlilerin psikolojisine ve refleksine sahip yazarlar var aramızda. çünkü futbolumuza dair bir çok şey kötü gidiyor, fatih terim daha yüksek sesle eleştiriliyor. bu yüzden bulabildikleri her fatih terim'i aklayacak bilgi parçacığına bile dört elle sarılıyorlar. bir zahmet, misliyle fazla para harcadığın, yine misliyle fazla medya ve hakem desteğine sahip olduğun bu leş ligin takımlarına karşı xg değerin yüksek olsun. ama avrupa kupalarında az biraz vasat üstü takımlara karşı xg verisi üretecek bir şey bile yapamıyoruz.

    ama ''biz aslında iyi oynuyoruz, şu kadar xg'miz var'' diyebilirsiniz. valla gülmem.
  • 54
    5 yıllık bir hiatus sonrası herkese merhaba. uzun bir süredir bu xg hakkında canımı sıkan bir şeyler vardı ancak adlandıramıyordum. aslında basit bir sorunun karşılığını görmediğim için başlamıştı, böyle bir istatistikte olmamasına imkan vermediğim bir eksiklik: possession futbol ve transition futbol takımlarının oyun etkisi ve değişkenleri. işim gücüm yok gibi bu kaşıntıya artık karşı koyamayıp ufak bir araştırma yapmaya karar verdim ve sonunda geldiğim nokta, benim canımı sıkan xg değil, xg’yi şimdiki zamanda yorumlayan izleyiciymiş.

    önce biraz xg’yi açalım. bütün stokastik modeller gibi belli formüllere ve prensiplere dayalı. yani her ne kadar insan faktörünü içine koymaya çalışsa da kendi içinde kapalı bir durumu söz konusu. bunu gözönünde bulunduran istatistikçiler zaten xg’yi günümüzü yorumlamak için ortaya atmamışlar. xg temel olarak bir takımın uzun bir sürelik maçlarını (bir sezon gibi) ele alıp, gelecekteki ilerleyebileceği yolu çizmede fikir sunuyor. bunu yaparken ele aldığı temel veriler 4 adet: şut çekecek kişinin pozisyonu, neresiyle vuracağı (kafa, ayak), pasın türü (orta mı, ara pas mı, duran top mu) ve son olarak pozisyonun nasıl hayat bulduğu (buildup play, top kapma, defansın yerleşme şansı olmuş mu, driplingle devam edilmiş mi).

    buna stokastik model demiş olsam da aslında tek bir formülasyonu yok maalesef. bu nedenle farklı istatistik sitelerinde farklı sonuçlar bulabilirsiniz. en temel farklılık şutu çeken oyuncunun pozisyon yorumu. araştırdığım sitelerde callum wilson’ın southampton’a attığı bir golü örnek vermişler. boş sayılabilecek bir kaleye penaltı noktasında şut çekiyor. birçok sitede bu 0,5 ile 0,66 xg olarak işlenmiş. bunun sebebi referans pozisyon azlığı. o noktadan çekilen şutların sadece %3’ü önü açık olarak çekilmiş. bunu yorumlayan istatistik siteleri de farklı sonuçlara ulaşıyor. mesela statsbomb aynı pozisyonu 0.97 xg olarak kaydetmiş.

    tek bir doğru xg yorumu olmadığını söyledikten sonra şimdi yapısal eksikliklere gelelim. zincirleme devam eden pozisyonların istatistiği konusunda bazı sıkıntılar var. yine araştırdığım bir sayfada, bir nürnberg maçındaki pozisyonu örnek almışlar. oyuncu kaleci yerindeyken şut çekiyor xg=0,37, şutu defans karşılıyor top tekrar önüne geliyor bu sefer kaleci yerinde değil ama bir defans var xg=0,68, top direkten dönüp önüne geliyor bu sefer boş kale xg=0,81. şimdi ilk sorun: normalde düz bir şekilde pozisyon toplamları alınırken burada toplam 1,86 olmakta ki bu imkansız. çünkü bir pozisyonda sadece bir gol üretebilirsiniz. bunu aşmak için defans yapan takım üzerinden olasılık hesaplayıp bunu 1’den çıkartarak atak yapan takımın xg’sini hesaplamaya çalışmışlar. bu da her pozisyonu ayrı ayrı 1’den çıkartıp çıkan sonuçları birbiriyle çaraparak elde edilmiş. bu pozisyonda çıkan sonuç %3,83 oranında defans yapan takımın golü önleyeceği. atak yapan takımın xg’si ise 0,9617 olarak ortaya çıkmış.

    şimdi ikinci soruna gelmiş olduk. birbiri ardı zincir pozisyonda son gol pozisyonu ilkinden ayrı düşünülemez, ancak aritmetik olarak eklenemez de. referans veri elimizde olmadığında xg verileri tamamen normal çizgisinden taşıyor. bu örnekte pozisyon sadece 2-3 saniyede yaşandığı için ayırmış olabiliriz ancak top oyundan çıkmadan, 1-2 dakika süren ataklarda benzer şekilde xg hesaplaması yapıldığında durumu ayırt etmesi daha da zor. dediğim gibi bir pozisyonda sadece bir gol üretilir ama bir pozisyonu neye göre belirliyoruz? devam eden oyun içinde ardışık iki gol pozisyonunu sayarsak, ikincisi ilkinin sonucu doğmuşken, ilkini saymak ne kadar doğru?

    xg’nin yetersiz olduğunu uzmanlar ona desteklemek için başka istatistik arayışlarına girmişler. bunun için stokastik modellerden biri markov modelini kullanmışlar. bunu yapmak için non-shot expecting goals, nsxg, ve expected threat xt kullanmışlar. nsxg’yi şöyle açıklayabiliriz; bir oyuncu ortasahada taç çizgisine yakın topla dururken gol tehlikesi neredeyse sıfırdır. orta açarsa ve top rakipten dışarı çıkarsa korner kazanır ve bunun tehlikesi %4 diyelim. başlangıç noktası %1 iken bu futbolcu orta açarak %4 çıkarmıştır ihtimali. futbolcu katkısı %3 olarak işlenir ve bu nsxg olarak kaydediliyor.

    expected threat ise daha formülize bir yapıya sahip. ve bence xg yorumu, xt ile yapılmalı. böylelikle bir takımın hücum aksiyonları ve sonuçlandırması üzerine daha sağlıklı verilerle konuşulabilir. ​​

    şu linte ingilizce olarak açıklanmış. https://karun.in/blog/expected-threat.html
    kısaca ball progression’a yani topun ilerleyşine bakıyor ve her oyuncunun pozisyona katkısını hesaplıyor. evet, gerçekten hesaplıyor. belli bir formülü var ve tek tek hesaplanabiliyor. henüz tamamlanmamış bir çalışma, gelecekte off the ball hareketlerini daha iyi içine katıp en doğru takım analizi istatistiği haline gelebilir.

    şimdi benim sorduğum basit soruyor cevaplandıralım. hayır maalesef possession futbol ve transition futbolun xg çalışması olmamış. sadece kendi çıkarımlarımı söyleyebilirim. nürnberg golündeki örneği düşünün, bir takım pozisyon sonuçlandırmadan ne kadar önde pozisyon yaratmaya çalışırsa o kadar xg artıyor ancak aslında biz biliyoruz ki top oyundayken sadece bir gol atılabiliyor. possession futbolda amaç rakibi ters ayakta yakalamak, pozisyon hatası yaptırmak için topu dolaştırmak ise, transition futbolda ise amaç bunu top ayağında bile değilken yapabilmek. possession futbolda haliyle daha fazla xg çıkabilmekte. galatasaray derdimiz olduğundan onun örneğini alalım. galatasaray takıntılı şekilde possession futbol oynamaya çalışıyor ancak istatistikte çıkan xg’ye göre çok düşük gol üretiyor. normalde istatistik okuyan biri bunu galatasaray’ın doğru yolda olması olarak okuyabilir. sahada olan ise bambaşka bir şey söylüyor. benim canımı sıkan da işte bu noktada izleyicinin xg oranlarına bakıp bunu sanki galatasaray iyi oynuyor ya da oynayabilir diye yorumlaması. bu istatistiğe bakarak futbolun güzelliği veya doğrusu konuşulamaz. possession futbolumuz ve xg’nin henüz tamamlanmamış bir istatistik olmasından dolayı possession futbol oynayan takımların xg’si için tabiri caizse kıyak geçmesinden dolayı yüksek görünüyor. izleyicinin bakması gereken nokta galatasaray’ın takıntılı şekilde bu oyunu oynarken, buna asla uymayan şekilde sahaya konumlanması. bunu da başka başlık altında uzun uzun yazacağım.

    şimdi tekrar xg, nsxg ve xt’nin sorunlarına. iki önemli hatası var, ilki temel fizikle açıklayabileceğim momentum. basketboldaki gibi iki takımın bir güç olarak ele alınabileceği oyun momentumunu da sayabilirsiniz elbette ama benim anlatacağım topum momentumu. xg’nin 4 temel aldığını söylemiştik ancak bunlardan hiçbiri topun hereketin ele almıyordu sadece pozisyon değişimini ele alıyor. biliyorsunuz beyzbol ve tenis gibi sporların puan kazanımının temelinde topun dönüş hareketi vardır. teniste bazen atak yapan oyuncu, a, defans yapan oyuncuya, b, birbirinin neredeyse aynı toplar atar. iki farklı noktaya, hep aynı şekilde. bunun amacı defans yapan oyuncunun o vuruşa alışıp kendini bir sonraki vuruşa aynı şekilde hazırlaması içindir. a, 4-5 vuruş sonrası yine aynı noktaya topu atarken bu sefer topun dönüş hızını değiştirecek şekilde vurur. defans yapan oyuncu b ise topu bir önceki pozisyondaki gibi vurmaya kalkarsa top ya fileye takılır ya da fazla yülselerek çıkar. dışarıdan bakan bir izleyici için topun hareketinde belki fark yoktur ancak tenisçi için sonuç bambaşkadır. üst düzey oyuncular rakibi çalışırken onların her bir hamlesini ve vuruşu tekniğini ezberleyerek çalışır. bu nedenle üst düzeyde bu atağı yapmak daha zordur.

    beyzbolda topun dönüşü her şeydir dersek yanlış olmaz. futbolda da kullandığımız knuckleball beyzbolda da vardır. futbolda knuckleball şutun kontrolü zordur ve kontrol da etseniz topun gidiş şekli genelde tesadüfidir. beyzbolda ise birden farklı knuckleball atış vardır. bunu da topun dönüş hızını kontrol ederek yaparlar. bunun dışında slide veya change up gibi atışlar da vardır. change up topu gidiş ritmini değişmiş gibi görünmesini sağlayan bir top dönüş şeklidir.

    futbolda ise bunların hiçbirine bakılmaz. bu nedenle pasın isabeti yeterli görünse de aslında topun momentumu şut çekecek oyuncunun alacağı sonucu etkileyen en önemli faktörlerdendir. rakibin ayağını sıyırarak gelen bir şuta vurmakla, iniesta’dan gelen bir topa direkt vurmak arasında dağlar kadar fark olur.

    ikinci hatası ise stokastik model olarak aynı markov modeli gibi o anki durumu ele alırken ondan önce olan durumları göz ardı eder. stokastik bir model olarak önceki durumu ele almayarak aslında akışkan bir oyun olan futbolun direkt yapısına karşı geliyor. zaten bütün mesele de burada, futbol beyzbol değildir, akışkan bir oyundur. o nedenle ne kadar iyi istatistiki veri ele alsak da asıl olması gereken her zaman buildup play sırasında gerçekleşen milyarlarca olasılıklı durumlardır. ilk hatayı temel fizikle anlatmıştık, bunu da kuantum ile anlatabilirim ama o kadar derine girip kaybolmayalım:)

    3 cümle yazıp çıkacaktım, yine saçma uzun bir yazı olmuş. kusura bakmayın, long post here is potato “0”
  • 173
    11 eylül 2022 kasımpaşa galatasaray maçı'nda iki takımın şut sayısı ve isabetli şut sayısı gibi gerekli istatistiklerine baktığımızda, şut sayısında galatasaray'ın bir adım önde olduğunu, isabetli şut sayısında da kasımpaşa'nın üstün olduğunu görebiliriz. bu durum maçı izlemeyen birine müsabakanın hakkının beraberlik olduğunu düşündürebilir.

    oysa gerçekte girdiği az sayıda net pozisyonu golle sonuçlandıran; onun dışında uzaktan cılız şutlarla kaleyi yoklayan, 30-35 metreden şişirilen toplarla bile bir şekilde muslerayı bulan bir kasımpaşa vardı maçta.

    maçı izleyen herkes görecektir ki galatasaray daha fazla pozisyona girdi ve birbirine yakın olan isabetli şut istatistiğinin aksine gole daha yakın olan taraftı. gereksiz istatistik xg'ye baktığımızda kasımpaşa'yı 0.80, galatasaray'ı ise 2.55 görerek bu durumu perçinleyebiliyoruz.

    tabii nadir örneklerde (kötü oynayan takımın 2 penaltı kazanması gibi) xg'nin de yanıldığını görebiliyoruz. tek başına çok fazla anlam yüklememek makul ama futbola bir zenginlik katan istatistiği argüman silahi yapıp kendisine karşı duygusal bir tavıra girmemiz sonra da yerden yere vurmaya çalışmamız son derece manasız duruyor.
  • 199
    çekilen her şutun gol olma ihtimalini inceleyen, makine öğrenimi tahmin modelidir. "expected goals" kısaltmasıdır, dilimizdeki karşılığı ise gol beklentisidir. farklı maçlarda farklı pozisyonlarda çekilen binlerce şuttan elde edilen ve sürekli gelişen bir veri tabanı oluşturulur. bu veri tabanı baz alınarak, çekilen şutların gol olma olasılığı hesaplanır. 0-1 skalasında bir değer aralığı vardır. 0 gol olması imkansız olan şutları temsil ederken, xg değeri 1 olan şutun her seferinde gol olması beklenir. xg modeline göre 0.2 xg değeri olan bir şutta, "ortalama" bir oyuncunun her 10 şutun 2 sini gole çevirmesi beklenir.

    xg, birden fazla parametre baz alınarak çıkarılan bir değerdir. şutun çekildiği nokta, asistin yapıldığı nokta, şutun ayakla mı kafayla mı çekildiği, şuttan önce dripling yapılıp yapılmadığı, asistin ne şekilde yapıldığı gibi farklı parametrelere bağlıdır. özünde xg, bir takımın maç boyunca girdiği pozisyonların kalitesini gösterir.

    istatistik firmaları, farklı databaseler kullanmaktadır. bu sebeple bir şutun xg değeri firmadan firmaya değişebilir. örneğin penaltı atışları wyscout'a göre 0.76 xg değerine sahipken, opta'ya göre bir penaltının xg değeri 0.79 olarak hesaplanmıştır. bundan sonra xg üzerinden pozisyon kalitesini değerlendirirken, penaltı atışlarını da referans noktası olarak alabiliriz.

    firmalar arasındaki farktan bahsederken, maç içi toplam xg değerlerinin firmadan firmaya neden bu kadar büyük değişiklik gösterdiğini biraz anlatmak istiyorum. çünkü eminim, aramızda benim gibi kafası karışanlar olmuştur. entry tarihi itibarıyla, mackolik ve beinsports xg verilerini opta'dan temin etmekte. hepimiz farketmişizdir ki opta verileriyle wyscout verilerinin arasında, özellikle bazı maçlarda, olağan dışı farklar gözüküyor. hatta yanlışım yoksa, her seferinde wyscout'un xg değerleri daha yüksek çıkıyor. bunun en büyük sebebi ise, wyscout bir pozisyonda çekilen tüm şutları total xg değerine eklerken, opta tek pozisyonda birden çok gol atılmaz ilkesiyle hareket ediyor. opta'nın formülü aslında mantık çerçevesinde yapılmış bir olasılık hesabı. pozisyonun "gol olmama" ihtimali hesaplanıp 1 den o ihtimalin değeri çıkarılıyor.

    diyelim ki, bir takım aynı pozisyonda iki şuttan sırasıyla 0.37 ve 0.55 gol beklentisi çıkarıyor. wyscout'ta toplam değer 0.92 artarken, opta'nın formülü farklı şekilde işliyor.

    (1- 0.37) x (1- 0.55)= 0.2835

    1 den bu değer çıkınca da ufak bir yuvarlamayla, 0.72 opta'ya göre bu pozisyonun xg değeri oluyor. eğer pozisyonda daha fazla şut olsaydı o değerler de aynı şekilde denkleme eklendikten sonra sonuç belirlenecekti. yukarıda bahsettiğim gibi şut değerleri, firmalar farklı databaseler kullandığı için, değişiklik gösterebiliyor. bu da hem pozisyonun xg'sinin, hem de total xg'nin firmadan firmaya göre değişmesine neden oluyor. fakat genel olarak, firmalar arası değerlerdeki o büyük farklar bu formül sebebiyle oluşuyor.

    bu ufak bilgilendirme sonrası konumuza dönebiliriz. xg metriğinin, her ne kadar çok şey gösterse de, bazı kusurları da vardır. oyun hakimiyeti, pres kalitesi, atak organizasyonu gibi başka önemli etkenler hakkında bilgi vermez. ayrıca, bazen xg yüksek olsa da verimli olarak üretilmemiştir. peki bunu nasıl anlayabiliriz?

    bir maçta atılan şut başına düşen ortalama xg ile şut verimliliği ölçülebilir. çeşitli araştırmalar çekilen şutların yaklaşık 10% unun gol olduğunu söylüyor. basit bir mantıkla şut başına 0.11 xg, şut verimliliği alt sınırı olarak düşünülebilir. mesela bir maçta 2 xg değeri eğer 30 şuttan çıkarıldıysa, şut başı xg 0.06 civarındadır. bu durumda 2 xg gayet yeterli görünse de, verimli bir şekilde üretilmemiştir. evet, fazla şut çekerek xg değeri bir nebze şişirilebilir. sonuçta her çekilen şut xg değerini yükseltir. fakat xg yukarıda bahsettiğim parametreler üzerinden hesaplandığı için, sadece defalarca uzaktan şut çekerek xg yükseltmek, tam anlamıyla mümkün değildir.

    https://dataglossary.wyscout.com/.../c4a44/635719742.png

    örneğin yukarıda verdiğim linkteki şutun xg değeri wyscout'a göre 0.006 olarak belirlenmiştir. yani wyscout'a göre o şutun gol olma ihtimali binde altıdır. bunun gibi 100 tane şut çekilen bir maçta elde edilecek total xg değeri 0.60 olur.

    https://dataglossary.wyscout.com/.../8b4c7/678490445.png

    xg'nin pozisyonun kalitesini tam anlamıyla gösteremediği ve asıl yetersiz kaldığı nokta ise, şut çıkmayan pozisyonlardır. yani yukarıdaki pozisyonun xg değeri wyscout'a göre 0.85 olsa da mane ıska geçseydi, pozisyona herhangi bir xg değeri biçilemeyecekti. aslında akıl almaz bir pozisyon kaçsa da xg değeri artış göstermeyecekti.

    uzun lafın kısası, xg eksikleri olsa da taş gibi bir metriktir. topla oynama yüzdesi, rakip ceza sahasında topla buluşma, korner, şut, isabetli şut, pas yüzdesi gibi basit istatistiklerden de çok daha anlamlıdır. sonuçta bir takım istediği kadar topla oynasın, şut çeksin, ceza sahasına girsin, pozisyon bulamadığı sürece bunların hiçbir değeri yoktur.

    gerçi bu ülkede golü bulamayınca girilen pozisyonların da pek değeri kalmıyor. algı ve yorumlar skora göre şekilleniyor, veri üzerinden yapılan dayanaklı yorumlar ise asla değer görmüyor. deli gibi xg üretilen maçlardan sonra bile galatasaray pozisyona giremedi denilebiliyor. neyse, biz yine verinin değerini bilelim. umarım bundan sonra xg başlığına tıkladığımızda da, sadece bitiricilik kalitemizden bahsedildiğini görürüz.

    not: entry depolandıktan 1 gün sonra (bkz: 5 kasım 2022 galatasaray beşiktaş maçı) oynandı. yukarıdaki temennim, entry henüz yayınlanmamış olsa da, kısmen gerçekleşti. mauro icardi 0.07 ve 0.21 xg ürettiği iki şuttan iki gol çıkardı. çok daha net pozisyonları yine kaçırdık. ümit ediyorum ki daha da iyi olacağız.
  • 27
    bu istatistikler çok şey ama her şey değil.

    koşu mesafesi; bakıyorsun adam en çok koşan oyuncu ama saha içinde bir varlığını hissedememişsin. rakip topu aldığında dibinde bitmemiş, ani kontra ataklarda top sürmemiş. sadece gitmiş gelmiş kaçak dövüşmüş.

    isabetli pas; oyuncu hiç riske girmeden, sürekli geriye hatta muslera'ya oynarsa, tabii ki istatistik onu ön plana çıkaracak.
    ileriye isabetli pas desen, o da göreceli durum. ilerideki bomboş adama atılan düz pas ile, topun yönünü ve şiddetini ayarlaman gereken bir pas arasında çok fark var. zor pasları deneyen adamın istatistiği kötü, sadece daha kolay ve garanti pasları deneyen adamın istatistiği iyi. işte bu kısım hepimizi yanıltıyor.

    gol beklentisi; özellikle bunu merak ediyorum, neye göre gol beklentisi?
    sağ çaprazdan emre akbaba'nın çektiği şut bu istatistiğe giriyor mu mesela? çünkü topun kaleye gitmesi mucize olur.
    babel'in sol çaprazdan yürüyerek gelip, sağa çekip vurduğu şut gol beklentisi olarak sayılıyor mu? çünkü %99 rakibe çarparak kontra yememize sebep oluyor.
    ama hiç istatistiğe girmeyen, belki anlık atılamayan bir pas belki de büyük gol beklentisiydi. özetlere bile girmez ama ''ah be soldan bomboş gidiyordu, görse çok tehlikeli olurdu'' dediğimiz pozisyonlar da oluyor.

    modern futbolda istatistik çok önemli. bu verilere önem verilmesi elzem oldu.
    fakat benim düşüncem bu verileri kullanmak, takip etmekle beraber, her şey olmadığının bilincinde olmak gerekiyor.

    takım iyi mi oynuyor, kötü mü oynuyor? bunun en büyük ölçütü tribünlerdir, taraftardır.
    galatasaray'ın maçını iple çekiyor musun, maçı büyük bir heyecanla izliyor musun, maçın bitişi yaklaşınca hafif üzülüyor musun, maçtan sonra defalarca kez geniş özeti izliyor musun, muhteşem oynadığımız maçtan sonra rıdvan'ın yüzünü görmek istiyor musun, bütün spor programlarını tek tek izleyip hakkımızda ne demişler merak ediyor musun ????

    ama son 2 yıldır, ''maçı izlemesem de olur'' modundayım. kazanırsak gollere bakıyorum, kaybedersek dünya ile bağlantımı koparıyorum. keyif almıyorum. böyle bir durumda, istatistikler isabetli pas attığımızı, en çok pozisyona giren takım olduğumuzu, hava toplarını en çok kazanan takım olduğumuzu yazsa ne olur yazmasa ne olur.
  • 16
    kaide kardeşim sağolsun bu verileri veriyor, yani bitiricilik konusunda sıkıntımız olduğu belli.
    0-0 giden bir maçta pozisyonları değerlendirememekle, 2-0
    önde olduğun bir maçta golleti atamamak aynı şey değil.
    ilk yarı 2-0 öne geçtik diyelim, iki golü de diagne attı.
    sonra iki de gol kaçırdı ama maç berabere bitti diyelim.
    maç sonu “diagne o golleri atsaydı maç böyle olmazdı” diyemezsin.
    adam zaten iki tane atmış, ne yani her maç korkulu rüya görmemek için 4-5 mi atmak gerekiyor?
    ben takımın gençleştiğini ve zaman verilmesi gerektiğini düşünüyorum.
    oyunun savunma kısmında eksik yaptığımız şeyler de olabilir, bunu düzeltiriz.
    kaybedilen puanlarla da zerre ilgilenmiyorum ama böyle saçma argümanlarla savunulmasın.
    0-0, 1-0 ve 2-1 olsa anlarım ama 2-0 öne geçmiş takım ve hocası bu bahaneye sığınamaz, sığınmamalı..
    bunlara sığınırsak yarın başka saçma argümanlar da buluruz.
    biz şu an için oyunun bazı kısımlarını iyi, bazı kısımlarını kötü oynuyoruz.
    zamanla düzeleceğine de eminim ve geleceğe umutla bakıyorum.
    ama bir takım 45. dakikada 2-0 önde olduğu maçı berabere bitirip, kaybetme tehlikesi yaşıyorsa suçu komple gol atamayan forvete yükleyemezsiniz.

    (bkz: 29 ağustos 2021 kasımpaşa galatasaray maçı)
  • 145
    aylar önce hakkında girdiğim entry en ofsaytlarımda duran pozisyon bulma ve gol üretme istatistiği. halbuki xg iyi oynayıp oynanmadığını değil pozisyon bulup bunu ne kadar değerlendirdiğinizi gösteren bir istatistiktir demiştim ve eklemiştim. galatasaray çoğu maçta iyi oynamıyor ama yine çoğu maçta maçı koparacak fırsatları yakalayıp atamıyordu. üstelik rakip de çok az pozisyon buluyordu ama bulduğunu atıyordu. bununla ilgili istatistikler zaten daha öncesinde paylaşıldı.
    ancak son 1 aydır hiç dalga konusu olmuyor bu xg. fatih terim yönetiminde 20 lig maçında 22 gol yenilirken, torrent yönetiminde 8 maçta 17 gol yedi takım. bizim bulduğumuz xg’ler azalmaya devam ederken rakiplerin artmaya başladı. tabi önceden oyuncular iyi olup hoca kötüyken, yaptığı rotasyonlarda adaletsiz damgası yenirken şimdi ise hoca iyi ama oyuncular kötü, rotasyon olduğunda ise hoca işi biliyor gibi saçmalıklar duymaya başladık. çıkarılan sonuç belli fatih terim’in eline gomis ve gedson’u verecektik oturup izleyecektik. ancak burak elmas nasıl bir yönetim kurmuşsa tek bir hamlede ne oyuncu aldı ne hoca kaldı. yazık, gerçekten yazık.
  • 78
    takım leş gibi oynarken, insanlar burunlarından solurken her daim insanların burnuna sokulursa elbette dalga geçmek için de tepe tepe kullanılacak istatistik. birkaç modeli var, bilimsel olarak daha yeni tutulmaya başlanan bir istatistik. yani gösterdiği şeyler şu an çok az.

    ama bizim takım ne zaman kötü oynayıp yenilse oyuncu kalitesi kaynaklı xg'ler hocayı savunmak için burada insanların burnuna sokulup herkes futbol cahili ilan ediliyor.

    liderden 21 puan fark yemenin xg'si kaç?

    not: 21 aralık 2021 adana demirspor galatasaray maçı özelinde konuşmuyorum.
  • 98
    ben hala insanların bu veriyi anlamadığını düşünüyorum.
    xg filan yok unutun, 28 aralık 2021 galatasaray denizlispor maçında kaçırdığımız golleri hepimiz izledik.
    hepsinin net olduğu konusunda herkes hemfikirdir herhalde.
    heh işte xg eğer çıkarsa attığımız goller de dahil pozisyonların oranını bize verecek.
    hayır neden hala bunun üstünden insanlara vuruluyor.
    aga hayvan gibi gol kaçırmışsın, adam da bunu sana rakam olarak veriyor. sen çok iyi veya kötü oynamışsın, ligde 10. olmuşsun bu onun derdi değil.
    2021 ocak ayında araba aldım. her depoyu doldurduğumda 100 km’de ortalama 7.5-8 litre arasında yakıt tüketiyor.
    araba ne bilsin 1 sene önce 7 tl olan benzinin 11.5 tl olduğunu.
    en nihayetinde o veri sağlıyor, 1 yıl önce deposuna 300 tl öderken şu an 470 tl ödemem onun sorunu değil.
    navigasyonla kavga eden kadın gibi millet xg ile takışıyor:)
  • 20
    bilimden her alanda faydalanmak lazım.

    xg de istatistik bilimi ile futbolu, pozisyonları geçmişten gelen verilerle harmanlayarak çıkartılan bir şey.

    senin xg'n yüksek golün düşük ise takımda bitiricilik sorunu var demektir. bu forvet tipiyle, formsuzlukla, pozisyonların oluş şekliyle vs açıklanabilir.

    burada bunu doğru okumak önemli.

    xg kadar pxg dedikleri değer de önemli. hatta daha önemli.

    gomis gibi kaleyi bulan 2 şutunun birini bir şekilde kaleye sokan, sürekliliği olan bir golcün varsa ve takımın pozisyona giriyorsa şampiyon olursun.
  • 117
    kınayt onlayn'da xp kasar gibi xg kasıyoruz.

    normalde maç için en değerli veridir. ancak her maç sonuç ile ters orantılı ise problem bu istatistikte değil buna çözüm bulmayan teknik ekiptedir.

    bu istatistiğe sarılıp fatih hocayı savunanlar olaya hatalı yaklaşıyorlar.

    fatih hocayı eleştirmek için bu istatistiği küçümseyenler de aslında ellerindeki önemli bir doneyi hiçe sayıyorlar.

    bir takım her maç yemesi gerekenden çok yiyor, atması gerekenden az atıyorsa problem genel çalışma şeklindedir. 10 maçta bir maç olabilir. o da en fazla.
  • 118
    kimsenin "xg istatistik verisi" ile bir sorunu olduğunu ya da bu veriyi anlamadığını düşünmüyorum. bu veri üzerinden insanlara ders verilmeye çalışılması ve onlara cahil muamelesi yapılması ile ilgili sorunu var insanların. sahada oynanan futbolu görüyoruz. galatasaray'ın ligdeki sıralamasını görüyoruz, bizim üstümüzdeki anadolu takımlarının kısıtlı bütçeleri ve bizim seviyemizde olmayan oyuncuları ile oynamaya çalıştığı futbolu aldıkları puanları görüyoruz. 3 yıllık planlama gençleştirme deyip de alt yapıdan çıkan genç cocuklara maçlarda verilen komik süreleri görüyoruz. ben basit bir futbolseverim ve en basitinden sene başında 27 yaşındaki ismail çipe ile yeni sözleşme imzalanırken ismail'in hangi kalecilik meziyetlerine göre mukavele uzatıldığını bilmek istiyorum ne sebeple maçlarda 11 başlatıldığını öğrenmek istiyorum. yetersiz olduğunu dünya alem biliyorken ısrarla kendisini takımda tutan ve oynatan hocanın futbolun hangi doğruları için bunu yaptığını taraftara anlatmasını istiyorum. halil dervişoğlunu aldırtan kişinin fatih terim olduğunu aynı terim'in mostafa muhammed'i 2021 ocak transfer döneminde adını deklare ederek aldırttığını biliyoruz şimdi bu oyuncuları gol kaçırması üzerinden eleştiriyoruz.

    bu takımın xg, gol kaçırma, duran toptan gol bulamama sorunlarından ziyade en başta teknik heyetin futbolcuları idare edememe sorunu, taktik disiplin eksikliği, saha içerisinde oyuncuların yaşadığı mental yönden eksiklikler, forma adalesizliği, liyakat gibi çok daha büyük problemleri var. bu sorunlara odaklanıp neşterin buraya vurulmasını istiyoruz.

    bir kısım taraftarın "söylediklerinin tam tersi çıktı diye çok sevdiği hocasına toz kondurmayayım" diye üzerinden ahkam kestiği, insanları cahil ilan ettiği istatistiki veri.
  • 99
    genel anlamda xg'niz iyi ancak attığınız gol düşükse bitiriciliğiniz kötü demektir. yani kaba tabirle kazmasınızdır.
    xg düşük attığınız gol yüksekse, bitiriciliğiniz yüksektir ya da ballısınızdır.
    xg düşük gol sayısı da düşükse, bitiricilikte sorun yoktur ancak gol pozisyonu üretmede sorun yaşıyorsunuz demektir.
    xg yüksek gol sayısı da yüksekse o zaman manchester city oluyorsunuz zaten.
  • 24
    galatasaray futbol takımı 2020-2021 sezonunun tamamında ve 2021-2022 sezonunun ilk 3 haftasında lider olduğu istatistik. ayrıca şutla bitmeyen önemli pozisyonları ve verilmeyen penaltıları rakiplerine göre çok daha fazladır.

    galatasaray futbol takımı bu istatistikte lider olduğu için, bu ölçme cihazı galatasaray sözlükte kötüleniyor. çünkü amaç, sürekli bir yerlerden galatasaray futbol takımını olduğundan daha da kötü göstermek ve yazarların göremediği şeyleri yokmuş saymak istemesi.

    her alanda olduğu gibi futbolda da dataya, istatistiğe önem verilmelidir. xg'de bu istatistiklerden sadece bir tanesidir.
  • 48
    niye hakkında meşruiyetini sorgulayıcı tartışmaların döndüğünü anlamadığım üzerine tezler ve makaleler yazılmış, dolayısıyla bilimselliği yıllar öncesinde kanıtlanmış bir metriktir. "expected goal (gol beklentisi)" adı ile literatürde bilinen bu metrik öyle bir metriktir ki özünde "bir takım tarafından yaratılan gol girişimlerinin kalitesini nasıl kantitatif (nümerik - sayısal) hale getirebiliriz?" sorusuna cevap arar. bunu da "gol fırsatı yaratan bir şutun değerini nasıl ölçebiliriz?" şeklindeki bir alt sorudan elde etmeye çalışır. bu noktada şutu çeken oyuncunun performansının da göz önünde bulundurulduğu açıktır. dolayısıyla a oyuncunun çektiği şutun yarattığı sayısal değer ile b oyuncununkinin bir olmayacağı bellidir. hatta a oyuncusunun x maçındaki şutu ile y maçındaki şutunun da değerinin aynı olmayacağı çıkarımında bulunulabilir.

    yapılan çalışmalar göstermiştir ki; bir takımın bulduğu gol dağılımı poisson dağılımına uymaktadır. bu öncül bilgi ile yapılan çalışmada binary olarak (gol oldu veya olmadı - 1 veya 0) target değişken; lojistik regresyon, karar ağaçları, rassal orman ve ada boost yöntemleri ile tahmin edilmiştir. bu modellerden elde edilen veriler auc performans metriği sayesinde olasılıksal olarak karşılaştırılmıştır. yazarlar bu aşamada da kalmayıp literatürde var olan platt kalibrasyonu ve izotonik regresyon yöntemlerini kullanarak fiili olasılıklar ile kalibre edilmiş olasılıklar (kalibre edilmiş modellerden elde edilen sonuçlar) arasındaki farkı gözlemlemiştir. bu verileri güven aralıkları ile destekleyerek bulgularına ulaşmışlardır.

    koca tezi açıklayarak uzatmak istemiyorum ama son olarak sonuçlarından bahsedeyim. yapılan bu çalışmanın amacı aslında takımların gol beklentisi üzerinden ev sahibi kazanır, berabere biter veya deplasman takımı kazanır şeklindeki tahmini yapmak. kalibrasyondan sonra elde edilen sonuçlar gayet tatmin edici olmuş olmalı çünkü f1-score yukarıda saydığım modellerin hepsinde %70-75 bandında çıkmış. ancak modellerin gol beklentisi istatistiğinin beraberliği işaret ettiği maçlarda genellikle yanıldığı ve bu tip maçlarında çoğunlukla bir tarafın tek fark ile kazandığı zorlu maçlar olduğu açıklanmış.

    bu konuyla ilgili o kadar çok çalışma var ki aklınız çıkar. çok basit bir literatür araştırmasından sonra birçok çalışmanın atıfta bulunduğu görece daha eski bir çalışmaya giderek bu bilgileri öğrendim. ilgili çalışmanın da başlığı şu: "expected goals in soccer: explaining match results using predictive analytics". eindhoven teknoloji üniversitesi'nde bir öğrencinin 2016 yılında yaptığı master tezi. buna benzer bir çalışmayı günümüzde ben yapacak olsaydım bir kere daha fazla sınıflandırıcı kullanırdım. xgboost ve lightgbm gibi modelleri de kesinlikle dikkate alırdım. optuna gibi kütüphaneler ile parametre optimizasyonu yaparak en ideal skora ulaşmaya çalışırdım ve en sonunda da ensemble modelling yaparak modelleri kombinlerdim. ayrıca sınıflandırma yaparken kullandıklarını ifade ettikleri kalecinin ve şutu çeken oyuncunun performansı gibi faktörlerin yanına hava durumu, maçın yapıldığı zeminin durumu gibi çeşitli featurelar da ekleyip çalışmayı daha anlamlı kılmaya çalışırdım. bunlar benim ilk anda aklıma gelen geliştirmeler olurdu. mutlaka 2016 yılından bu yana daha başarılı modeller de ortaya konulmuştur. merak eden araştırabilir. benim bu entryi yazmamdaki amaç akıllardaki bulutları biraz olsun dağıtmak ve anlamsız şüphelerin önüne geçmekti.
  • 49
    ben de bir katkı yapayım. xg istatistiği ölçülürken kullanılan modellerin ne olduğunu bilmiyorum ama istatistikten daha doğrusu ekonometri’den anlarım. yüksek lisans tezimde enflasyon belirsizliğini ölçmüştüm. dolayısıyla literatürde beklentiyi ve hatta belirsizliği ölçebilen modellemeler var. benim katkım, hiç bir istatistik dersi almamış arkadaşlar için daha açıklayıcı olması yönünde bir analojik katkı olacak.

    öncelikle matematik ile istatistik arasındaki farkı basit bir şekilde göstereyim:

    matematik => y=2x+3 denkleminin türevini “x 1 birim arttığında y 2 birim artar” şeklinde yorumlar

    istatistikte ise bu bir denklem değil modele dönüşür ve denklemin sonuna bir harf eklenir: “u” yani hata terimi => y=2x+3+u modelinde türev artık şöyle yorumlanır “x 1 birim arttığında y’nin 2 birim artma olasılığı vardır”. güven aralığı (genellikle %90, %95, %99) dediğimiz kavramı işin içine katmak istersek yorumu şu şekilde yapabiliriz: “x 1 birim arttığında y %95 ihtimalle 2 birim artacaktır”

    işte formel bir bilim olan istatistikte aslında en büyük uğraş bu hata terimidir, onu minimize etmektir. şimdi bunu bir analojiyle açıklamaya çalışayım:

    “elimizdeki bardağı yere bırakırsak kırılır.” bu ilişkideki hata terimi epey yüksektir dolayısıyla açıklayıcılık gücü zayıftır. kırılacağına yönelik beklentimizin güçlenmesi için ilave bilgilere ihtiyacımız var. örneğin zeminin sertliğini, bardağın hangi malzemeden yapıldığı ve dayanaklılığı, ne kadar yükseklikten bırakıldığı, hangi hızla yere çarptığı vs. bu bilgilere sahipsek ilgili verileri modele dahil ederek hata terimini minimize eder açıklayıcılık gücünü arttırız ve böylece “beklentimiz”, kesinliğe yaklaşır.

    umarım bu analoji “gol beklentisi ölçülebilir mi?” ya da “beklentinin ölçülmesinin mantığı ve yöntemi nedir?” sorularına bir cevap olabilmiştir.
  • 75
    milletin bu kadar takık olmasının sebebi xg'nin galibiyetten önde tutulması. neticede istatistik ciddiye alınır. bu takım kötü oynuyor kötü, adamlar buna bakmayıp xg'miz yüksek ama atamıyoruz şans yok diyor. arkadaş burada real madrid'le, city'le falan oynamıyoruz senin bütçenin 10da1'i takımlar oynuyorsun pozisyona onlardan fazla girmen doğal. 7 maçtır galibiyet alamayan öncesinde top oynamayan takım xg ile övülmesin artık bir zahmet.
App Store'dan indirin Google Play'den alın