Sanayi Mühendisliği Kısmında vazifeli Dr. Tedrisat Üyesi İbrahim Sabuncu ve mekteplisi Zeynep Yürek’ten oluşan ekip, toplumsal medya analitiği üzerine “Koronavirüs Türkçe Tweet Done Seti” çalışması başlattı.
Türkiye’de birinci vakanın görülmesinin akabinde, bu bahiste toplumsal medya platformu Twitter’da paylaşılan Türkçe iletileri toplayan ekip, 23 Nisan’da 4,8 milyon tweetin bulunduğu done setini duyurdu.
Sabuncu ve mekteplisi, daha sonra dünyanın önde gelen mühendislik tertibi olup 420 binden fazla üyesi bulunan Elektrik ve Elektronik Mühendisleri Enstitüsünün (IEEE) olgu tabanına yükleme yaptı. IEEE’nin düzenlediği müsabakada 3’üncü olan ekip, bu çalışmayı Türkiye Ilmî ve Teknolojik Araştırma Kurumunun (TÜBİTAK) data setleri kısmına de aktardı.
“Veri seti, kestirim ve tedbire çalışmalarında kullanılabilecek”
Dr. Tedrisat Üyesi İbrahim Sabuncu, yaptığı açıklamada, yarışmada kullandıkları done setini, Kovid-19’un Türkiye’deki toplumsal tesirlerini araştırmak emeliyle hazırladıklarını söyledi.
Koronavirüsle ilgili Türkçe yazılmış Twitter iletilerini “veri madenciliği” yazılımıyla topladıklarını belirten Sabuncu, şöyle devam etti:
“Bu tweetler, Kovid-19’un Türkiye’ye toplumsal tesirleri ile ilgili toplumsal medya tahlili, metin madenciliği, bahis modelleme üzere çalışmalar yapmak için değerli bir done kaynağı oluşturmaktadır. Bu doneler, Türkiye’deki kişilerin Kovid-19 ile ilgili endişelendikleri bahisleri, gereksinimlerini, beklentilerini, başkanlardan taleplerini anlamak, virüsün yayıldığı noktaları, yayılma suratını ve gelecekteki vaka sayılarını iddia edebilmek, Kovid-19 ile ilgili kasıtlı, yalan, yanlış haber ve haber paylaşanları tespit edebilmek üzere pek çok farklı mevzu ile ilgili yapılacak tahlillerde kullanılabilecek.”
Done toplamaya, Türkiye’de birinci vakanın görüldüğü 11 Mart’ta başladıklarına değinen Sabuncu, sair araştırmacıların da yararlanabilmesi için bu bilgileri TÜBİTAK ve IEEE’nin done portalına yüklediklerini lisana getirdi.
Sabuncu, “TÜBİTAK’ın Kovid-19 portalında bizden evvel İngilizce done seti vardı. Biz yükledikten sonra Türkçe tweet done setimize erişilebiliyor. Burada yüklü data setimiz 4,8 milyon tweet barındırıyor fakat 23 Nisan sonrası da olgu toplamaya devam ettiğimiz için bu sayı 6 milyona ulaştı.” dedi.
“Ülkemiz, üniversitemiz ismine mutlu olduk”
Sabuncu, emellerinin Türkiye’de Kovid-19 ile ilgili toplumsal medya analitiği üzerine çalışmalar yapan bilim kişilerinin done setinden faydalanmasını sağlamak olduğunu aktardı.
Data setini IEEE portalına yüklerken bir yarışa da katıldıklarını anlatan Sabuncu, şunları kaydetti:
“Bizim done setimiz, en fazla ziyaretçi alan 3’üncü done seti oldu. Doğal biz bu durumda memleketimiz, üniversitemiz ismine mutlu olduk. Türk bayraklı logomuzun olduğu olgu setimizin listeye girmesi bizi onore etti. Doğal bizim asıl maksadımız, koronavirüsle uğraşta yararlı haberlerin üretilmesi, hem ilmî hem de halka yarar sağlayacak bir çalışma yapmaktır. Bu çalışmamızı önümüzdeki periyot ahir bitirip sonucunu paylaşacağız.”
Toplumsal medya analitiğinin pek çok bahiste kullanıldığı haberini veren Sabuncu, kasım ayında ABD’de yapılacak başkanlık seçimleri iddiası için de yeni bir data yekuna çalışması başlattıklarını ve bunu seçimlerden evvel açıklamayı hedeflediklerini laflarına ekledi.
Hürriyet