Koronavirüs sürecinde atılan Türkçe tweet’ler toplandı

Sanayi Mühendisliği Kısmında hizmetli Dr. Tedrisat Üyesi İbrahim Sabuncu ve talebesi Zeynep Yürek’ten oluşan ekip, toplumsal medya analitiği üzerine “Koronavirüs Türkçe Tweet Olgu Seti” çalışması başlattı.

Türkiye’de birinci vakanın görülmesinin akabinde, bu hususta toplumsal medya platformu Twitter’da paylaşılan Türkçe bildirileri toplayan ekip, 23 Nisan’da 4,8 milyon tweetin bulunduğu done setini duyurdu.

Sabuncu ve talebesi, daha sonra dünyanın önde gelen mühendislik tertibi olup 420 binden fazla üyesi bulunan Elektrik ve Elektronik Mühendisleri Enstitüsünün (IEEE) data tabanına yükleme yaptı. IEEE’nin düzenlediği yarışta 3’üncü olan ekip, bu çalışmayı Türkiye Ilmî ve Teknolojik Araştırma Kurumunun (TÜBİTAK) data setleri kısmına de aktardı.

“Veri seti, varsayım ve tedbire çalışmalarında kullanılabilecek”

Dr. Talim Üyesi İbrahim Sabuncu, yaptığı açıklamada, yarışmada kullandıkları olgu setini, Kovid-19’un Türkiye’deki toplumsal tesirlerini araştırmak emeliyle hazırladıklarını söyledi.

Koronavirüsle ilgili Türkçe yazılmış Twitter bildirilerini “veri madenciliği” yazılımıyla topladıklarını belirten Sabuncu, şöyle devam etti:

“Bu tweetler, Kovid-19’un Türkiye’ye toplumsal tesirleri ile ilgili toplumsal medya tahlili, metin madenciliği, husus modelleme üzere çalışmalar yapmak için kıymetli bir done kaynağı oluşturmaktadır. Bu datalar, Türkiye’deki kişilerin Kovid-19 ile ilgili endişelendikleri bahisleri, muhtaçlıklarını, beklentilerini, başkanlardan taleplerini anlamak, virüsün yayıldığı noktaları, yayılma suratını ve gelecekteki vaka sayılarını iddia edebilmek, Kovid-19 ile ilgili kasıtlı, yalan, yanlış haber ve haber paylaşanları tespit edebilmek üzere pek çok farklı bahis ile ilgili yapılacak tahlillerde kullanılabilecek.”

Done toplamaya, Türkiye’de birinci vakanın görüldüğü 11 Mart’ta başladıklarına değinen Sabuncu, gayrı araştırmacıların da yararlanabilmesi için bu bilgileri TÜBİTAK ve IEEE’nin done portalına yüklediklerini lisana getirdi.

Sabuncu, “TÜBİTAK’ın Kovid-19 portalında bizden evvel İngilizce done seti vardı. Biz yükledikten sonra Türkçe tweet data setimize erişilebiliyor. Burada yüklü olgu setimiz 4,8 milyon tweet barındırıyor lakin 23 Nisan sonrası da data toplamaya devam ettiğimiz için bu sayı 6 milyona ulaştı.” dedi.

“Ülkemiz, üniversitemiz ismine şad olduk”

Sabuncu, gayelerinin Türkiye’de Kovid-19 ile ilgili toplumsal medya analitiği üzerine çalışmalar yapan bilim kişilerinin olgu setinden faydalanmasını sağlamak olduğunu aktardı.

Done setini IEEE portalına yüklerken bir yarışa da katıldıklarını anlatan Sabuncu, şunları kaydetti:

“Bizim done setimiz, en fazla ziyaretçi alan 3’üncü olgu seti oldu. Olağan biz bu durumda devletimiz, üniversitemiz ismine mutlu olduk. Türk bayraklı logomuzun olduğu data setimizin listeye girmesi bizi onore etti. Alışılmış bizim asıl emelimiz, koronavirüsle savaşta yararlı haberlerin üretilmesi, hem ilmî hem de halka yarar sağlayacak bir çalışma yapmaktır. Bu çalışmamızı önümüzdeki periyot ahir bitirip sonucunu paylaşacağız.”

Toplumsal medya analitiğinin pek çok mevzuda kullanıldığı haberini veren Sabuncu, kasım ayında ABD’de yapılacak başkanlık seçimleri varsayımı için de yeni bir olgu yekuna çalışması başlattıklarını ve bunu seçimlerden evvel açıklamayı hedeflediklerini laflarına ekledi.