Site Rengi

Verilerin Düzenlenmesi ve Analizi

Verilerin Düzenlenmesi ve Analizi

Verilerin Düzenlenmesi ve Analizi
10.06.2021
17
A+
A-

Verilerin Düzenlenmesi ve Analizi

Araştırma sonucu çeşitli yöntemlerle elde edilen verilerin bir anlam ifade edebilmesi, bir hüküm bildirebilmesi için düzenlenmesi ve yorumlanması gerekir. Araştırmacının derlediği verilerin sayısı az ise yorumlanması kolay olacaktır. Fakat araştırmalarda az sayıda veri ile yetinmek genellemelere varmayı güçleştireceğinden araştırmanın geçerliliği açısından daha çok verinin toplanması gerekir. Veri sayısı arttıkça da verilerin yorumlanması güçleşecektir. Örneğin; bin kişiye uygulanan on soruluk bir anketin sonuçlarının belli bir analiz yöntemi kullanmadan değerlendirilmesi mümkün olmayacaktır. İşte bu amaçla bilimsel araştırmalarda verilerin yorumlanmasını sağlayacak yöntemlere ihtiyaç duyulur. Bu yöntemleri ise istatistik bilimi ele alır.

İstatistik; sayısal bilgileri toplama, analiz etme, anlamını açıklama, bilgilerin güvenilirliğini yansız bir biçimde yorumlamayı ve ortaya çıkarmayı hedef edinen bir bilim dalıdır.

Tanımdan da anlaşılacağı üzere bir verinin istatistik yöntemleriyle incelenebilmesi için o verinin sayısal bir dille ifade edilmesi gerekir. Araştırmanın alanı ne olursa olsun araştırmadan elde edilen verilere sayısal bir nitelik kazandırılabilir. Örneğin; bir sınıfta öğrencilerin okuma alışkanlıklarını inceleyen bir araştırmada ilk bakışta sayısal verilerin yeri yokmuş gibi görünebilir. Ama araştırmacının bir sonuca varabilmesi için verileri sayısallaştırması gerekir. O halde önce öğrencilerin hangi kitapları okuduklarına dair bir soru formu oluşturulur. Alınan bilgiler ışığında verilen kitap isimleri belli gruplara ayrılabilir. Diyelim bu sınıfta otuz öğrenci olsun, öğrencilerin verdiği isimlere göre kitapları roman, hikaye, tarih, fizik ve gökbilimi olmak üzere beş gruba ayırıp her gruba düşen kitap sayısı belirlenir ve bu sayı yorumlanabilir. Araştırma sonucunda öğrencilerin en çok ilgi duydukları okuma alanı sayısal olarak belirlenebilir.

Sayısallaştırılan bu veriler artık istatistik yöntemleriyle incelenip yorumlanabilir. İstatistiki yorumlama için bilinmesi gereken temel kavramlar şunlardır:

Yığın: Veri birimlerinin oluşturduğu topluluktur.

Değişken: Sayılarla ifade edilen verilere değişken denir.

Değişken değer aralığı: Bir değişkenin alabileceği en küçük değer ile en büyük değer arasındaki sayıların tümüne değer aralığı denir.

Bu kavramları bir örnekle anlamaya çalışalım. Örneğimiz; A okulundaki öğrencilerin ortalama ne kadar harçlıkla okula geldiklerinin araştırılması olsun.

Bu örneğe göre:
Değişken; her bir öğrencinin cebindeki harçlık miktarıdır.
Yığın; tüm okul öğrencilerinin harçlıklarının tek tek oluşturduğu bütündür.
Değişken değer aralığı; en az harçlığı olan öğrenciyle harçlığı en çok olan öğrencinin harçlıkları arasındaki değerlerdir.

Bu örnek bizi farklı bir probleme götürmektedir. Okulda 1000 öğrenci olsa her birinin harçlığını değerlendirmek zor bir iş olacaktır. Bunun kolaylaştırılması için bu verilerin düzenlenmesi gerekir.
Bu düzenleme iki şekilde yapılabilir.

Sıralı Dizi: Sayısal bilgilerin küçükten büyüğe ya da büyükten küçüğe doğru sıralanmasıyla elde edilen dizidir.

Çokluk Bölünümü (Gruplandırma): Verilerin belli sayıda büyüklük sınıflarına göre gruplara ayrılmasıdır. Böyle oluşturulan gruplara sınıf, her sınıftaki birim sayısına sınıf çokluğu denir.

Yukarıda verilen örnekte öğrencilerin harçlık değerlerini en küçükten en büyüğe doğru sıralayarak yazarsak bir sıralı dizi oluşturmuş oluruz. Eğer öğrencilerin harçlıklarını onar liralık bölümlere ayırırsak çokluk bölümünü halinde sınıflandırmış oluruz.

Sıra numarasıHarçlık miktarlarıÖğrenci sayısı
10< x ≤10900
210< x ≤ 2050
320< x ≤3020
430< x ≤ 4015
540< x ≤ 505
650< x ≤ 604
760< x ≤ 702
870< x ≤ 801
980< x ≤902
1090< x ≤….1

Yukarıda çokluk bölümünü on sınıfa ayırmış olduk 1.sütün sınıf sıra numaralarını 2. sütun sınıf değerlerini, 3. sütun ise her sınıf değerinin kaç kez tekrarlandığını göstermektedir.

Bu sıralamada 10 numaralı sıraya dikkat edilmelidir. Bu tip sıralar açık uçlu sıralardır. Yani bu gruptaki öğrencilerin harçlıkları 90 liraya eşit ya da 90 liradan büyüktür. Ne kadar büyük olduğu ise önemsizdir. Bu gruptaki öğrenciler 90 lira harçlıklı da olabilir 150 lira ya da daha farklı olabilir. Sıralar oluşturulurken her sıranın birbirinden ayrıldığı rakamsal değerler net olmalıdır.

Yine aynı sıralamayı;

Sıra numarasıHarçlık miktarlarıÖğrenci sayısı
10 – 10900
210 – 2050
320 – 3020
430 – 4015
540 – 505
650 – 604
760 – 702
870 – 801
980 – 902
1090 – ….1
1000

Şeklinde yapacak olursak sınıflardaki öğrenci sayıları birbirine karışır. Bu yüzden ayrımlamalara özen gösterilmeli ve net ayrımlar yapılabilmelidir.

Şimdi yeni bir örnekte öğrendiklerimizi tekrar edelim.

50 öğrencinin babalarının yaşları şöyledir.

68537485743854563869
73427535394040404273
45585862645145614648
49384654555858613839
40414338424647504950

Herhangi bir düzenleme yapılmamış verilere yığın diyoruz. Yukarıdaki yığını küçükten büyüğe doğru sıralarsak sıralı dizi elde ederiz.

35383838383839394040
40404142424243454546
46464748494950505153
54545556585858586161
62646869737374747485

Yukarıdaki sıralı diziye çokluk bölünümü uygulayıp gruplandırılmış bir dizi elde edebiliriz.

Bunun için önce dağılım aralığını bulalım.

Dağılım aralığı= en büyük değişken – en küçük değişken
D.A = 85 – 35 = 50

Bu noktada bir sınıf sayısı kararlaştırmak gerekir. Sınıf sayısını araştırmanın niteliğine göre dilediğimiz gibi belirleyebiliriz. Sınıf sayısını 5 olarak belirleyelim. Yani yukarıdaki verileri beş sınıf oluşturacak şekilde düzenleyelim.

Sıra numarasıYaşlarKişi Sayısı
135< x ≤ 4517
245< x ≤ 5515
355< x ≤ 6510
465< x ≤ 756
575< x ≤ 852
50

Bu düzenlemeyi yaptıktan sonra aynı örneği kullanarak yeni istatistik bilgilerini öğrenebiliriz.

Aritmetik Ortalama; verilerin ağırlıklı olarak bulunduğu, yoğunlaşmanın gözlemlendiği merkez eğilim ölçüsüdür. Son derece yaygın olarak kullanıldığı için genelde bilinen bir yöntemdir.

Aritmetik ortalama gruplanmış verilerde ve gruplanmamış verilerde farklı yöntemlerle hesaplanır.

Gruplanmamış verilerde aritmetik ortalama; bütün verilerin sayısal değerlerinin toplanarak veri sayısına bölümü ile bulunur.

35383838383839394040
40404142424243454546
46464748494950505153
54545556585858586161
62646869737374747485

Aritmetik ortalama (A.O.) = verilerin sayısal değerleri toplamı ÷ Toplam veri sayısı

A.O. = 2588 ÷ 50 =51,76 = 52 olarak bulunur.

Gruplandırılmış verilerde ise ortalama hesaplanabilmesi için önce sınıf orta değerlerinin bulunması gerekir. Sınıf orta değeri sınıf alt değeri ile sınıf üst değerinin toplanıp ikiye bölünmesi ile bulunur.

Sıra numarasıYaşlarKişi sayısı
135< x ≤ 4517
245< x ≤ 5515
355< x ≤ 6510
465< x ≤ 756
575< x ≤ 852

Birinci sıradaki sınıf alt değerimiz 35 üst değeri ise 45 tir.
Sınıf orta değeri ise 35 + 45 / 2 = 40 bulunur.

Örneğimizdeki tüm sınıf orta değerlerini bulalım.

Sıra numarasıYaşlarKişi sayısı
135 + 45 ÷ 2 = 4017
245 + 55 ÷2 = 5015
355 + 65 ÷ 2 = 6010
465 + 75 ÷ 2 = 706
575 + 85 ÷2 = 802

Gruplanmış verilerde aritmetik ortalama sınıf orta değerleri ile o sınıfa ait veri sayısının çarpımının toplam ver sayısına bölünmesi sonucunda bulunur.

A.O = (40 x 17) +( 50 x 15) + (60 x 10) +( 70 x 6) + (80 x 2) / 50
A.O. = 680 + 750 + 600 + 420 + 160 / 50
A.O. = 2610 ÷ 50
A.O. = 52,2

Ortanca; medyan olarak da bilinen bu yöntem ortalama belirleme amacıyla kullanılan bir istatistik kavramıdır. Hesaplanışı gruplanmış ve gruplanmamış verilerde farklıdır.

Gruplanmamış verilerde ortanca

Hesaplanması oldukça basittir. Yığın sıralı dizi haline getirilir. Gruptaki veri sayısı ikiye bölünür. Elde edilen rakama karşılık gelen veri ortancayı verir.

Örneğimize bakalım;

35383838383839394040
40404142424243454546
46464748494950505153
54545556585858586161
62646869737374747485

Burada toplam 50 veri vardır. O halde 50 / 2 = 25 tir.

Sıralanmış dizideki 25. değer ( 49 ) bize ortancayı verir.

Toplam veri sayısının tek rakamlı bir sayı olması durumunda ise toplam veri sayısına 1 eklenip 2 ye bölünerek aynı işlem yapılır.

Gruplanmış verilerde ortanca

Gruplanmış verilerde ortancanın hesaplanmasında ilk yapılacak iş ortancanın hangi sınıf içerisinde kaldığını tespit etmektir.

Ortancanın hangi sınıf içerisinde kaldığının tespiti gruplanmamış verilerde kullanılan yöntemle yapılır. Veri sayısı toplamı çift sayıysa 2 ye bölünür. Tek sayıysa 1 eklenir 2 ye bölünür.

Bizim örneğimizde veri sayısı çifttir.

O halde bu örnekte 50 / 2 = 25 bulunur. Bizim ortanca dediğimiz 25. verinin bulunduğu sınıf aralığı içerisindedir. Yani ikinci sınıf aralığı içerisindedir.

Ortancanın hangi sınıf aralığında olduğunun kolayca görülebilmesi için sınıf aralıklarına düşen veri sayısının toplamları da tabloya eklenmelidir.

Sıra numarasıYaşlarKişi sayısıVeri sayısı toplamları
135< x ≤ 451717
245< x ≤ 551532
355< x ≤ 651042
465< x ≤75648
575< x ≤ 85250

Bu tespitten sonra ortancayı bulmak için aşağıdaki bilgilere ihtiyaç vardır.

  • L = Ortanca Sınıfı Sınıf Alt Değeri
  • C = Ortanca Sınıfı Sınıf Aralığı
  • F = Ortanca Sınıfı Sınıf Çokluğu ( toplam veri sayısı)
  • N = Yığının Birim Sayısı
  • D = Ortanca Sınıfına Kadar Olan Toplam Birim Sayısı

Formülü ise şöyledir.
Or. = L + (c / f) x [ ( N / 2) – d]

değerleri yerlerine koyacak olursak.

Or. = 45 + (10 / 15) x [ (50 / 2) – 17]
Or. = 45 + (0.66) x [ 25 – 17]
Or. = 45 + (0.66) x 8
Or. = 45 + 5.28
Or. = 50.28 = 50 bulunur.

Tepe Noktası ( Mod )

Gruplanmamış dizilerde en çok tekrar edilen değerdir.

35383838383839394040
40404142424243454546
46464748494950505153
54545556585858586161
62646869737374747485

En çok tekrar edilen sayı 38 olduğundan dolayı mod 38 dir.

Gruplanmış serilerde tepe noktası varyans ve standart sapma hesapları kapsamlı istatistik bilgi gerektirdiğinden burada yalnızca tanımları verilmekle yetinilecektir.

Varyans; birim değerlerin aritmetik ortalamadan ne ölçüde farklı olabileceğini ortaya koyan bir dağılım ölçüsüdür.

Standart sapma; varyansın pozitif işaretli kareköküdür.

UYGULAMA FAALİYETİ

Aşağıdaki uygulamayı yapınız.

Okul ya da iş ortamlarınızdaki herhangi bir durumu tespit etmek amacıyla on soruluk bir anket hazırlayarak, elli kişi üzerinde uygulayıp sonuçlarını istatistik yöntemlerle değerlendiriniz.

İşlem BasamaklarıÖneriler
Öncelikli olarak tespit etmek istediğiniz durumu belirleyiniz.Örneğin bu durum; okulunuzdaki öğrencilerin başarılarını etkileyen sebepler, çalıştığınız işletmenin müşterilerinin karşılaştığı sorunlar ya da beklentiler, sevilen ve başarılı olunan derslerde arkadaşlarınızın başarılı olmalarını etkileyen nedenler vb. olabilir.
Ankette hangi tip soruları uygulayacağınıza karar veriniz.Anket sorularını -evet hayır- şeklinde hazırlamanız cevaplamayı kolaylaştırır. Çoktan seçmeli yaparsanız daha fazla alternatifi değerlendirebilirsiniz. Bu gibi sebepleri değerlendirerek size öğretilen herhangi bir soru tipini seçiniz.
Anket sorularını belirleyiniz.
Anket formunu düzenleyin ve uygulayınız.Anket formunu düzenlerken güzel ve sade görünmesine özen gösteriniz.
Elde ettiğiniz verileri istatistik yöntemleri kullanarak yorumlayınız ve bir sonuca ulaşınız.Konunuza göre bir yargı bildirebilecek biçimde verileri düzenleyiniz. İstatistik yöntemleri kullanarak bir sonuca ulaşın. Örneğin 50 kişiden yüzde kaçının Türkçe dersinde başarılı olduğunu belirleyebilirsiniz. Ya da kız öğrencilerin başarı ortalamasını erkek öğrencilerin başarı ortalamasıyla karşılaştırabilirsiniz.
YORUMLAR

Henüz yorum yapılmamış. İlk yorumu yukarıdaki form aracılığıyla siz yapabilirsiniz.