Materi Visualisasi [PDF]

  • 0 0 0
  • Suka dengan makalah ini dan mengunduhnya? Anda bisa menerbitkan file PDF Anda sendiri secara online secara gratis dalam beberapa menit saja! Sign Up
File loading please wait...
Citation preview

Bab 4 Visualisasi: Menggunakan Visualisasi dan Ringkasan untuk Berbagi Hasil dengan Pemangku Kepentingan TUJUAN LO 4-1 Tentukan tujuan visualisasi data Anda LO 4-2 Pilih bagan terbaik untuk kumpulan data Anda LO 4-3 Perbaiki bagan Anda untuk berkomunikasi secara efisien dan efektif LO 4-4 Komunikasikan hasil Anda dalam report tertulis Data itu penting, dan Analisis Data efektif, tetapi mereka hanya sama pentingnya dan efektifnya karena kita dapat berkomunikasi dan membuat data dapat dimengerti. Salah satu penulis sering bertanya kepada murid-muridnya apa yang akan mereka lakukan jika mereka magang dan bos mereka meminta mereka untuk memberikan informasi mengenai di negara bagian mana semua pelanggan yang dilayani organisasinya berada. Apakah mereka hanya mengarahkan bos mereka ke tabel Pelanggan di database penjualan? Apakah mereka akan melangkah lebih jauh dan mengisolasi atribut untuk Nama Perusahaan dan Negara? Mungkin mereka bisa melangkah lebih jauh dan menjalankan kueri cepat atau PivotTable untuk menghitung jumlah pelanggan di setiap negara bagian berbeda yang dilayani perusahaan. Namun, jika mereka memberi bos mereka apa yang sebenarnya dia inginkan, mereka harus memberikan ringkasan tertulis singkat tentang jawaban atas pertanyaan penelitian, serta bagan terorganisir untuk memvisualisasikan hasilnya. Visualisasi data tidak hanya untuk orang-orang yang merupakan pelajar "visual". Ketika hasil analisis data divisualisasikan dengan tepat, hasilnya dibuat lebih mudah dan lebih cepat untuk ditafsirkan untuk semua orang. Apakah data yang Anda analisis adalah data "kecil" atau data "besar", mereka masih layak sintesis dan visualisasi untuk membantu pemangku kepentingan Anda menafsirkan hasil dengan mudah dan efisiensi. Pikirkan kembali beberapa visualisasi data pertama dan kategorisasi yang Anda hadapi (piramida / piring makanan panduan makanan, kerajaan hewan, tabel periodik) dan, lebih modern, seberapa sering infografis diterapkan untuk memecah serangkaian informasi rumit di media sosial. Grafik dan infografis ini memudahkan orang untuk memahami konsepkonsep sulit dengan memecahnya menjadi kategori dan komponen visual.



4.1 MENENTUKAN TUJUAN VISUALISASI DATA ANDA Seperti halnya memilih dan menyempurnakan model analitis Anda, mengkomunikasikan hasil lebih banyak seni daripada sains. Setelah Anda terbiasa dengan alat yang tersedia, tujuan Anda harus selalu berbagi informasi penting dengan para pemangku kepentingan dengan cara yang jelas dan ringkas. Ini bisa melibatkan grafik atau grafik, kotak callout, atau beberapa statistik utama. Visualisasi telah menjadi sangat populer selama tiga dekade terakhir. Manajer menggunakan dasbor untuk dengan cepat mengevaluasi indikator kinerja utama (KPI) dan dengan cepat menyesuaikan tugas operasional; Analis menggunakan grafik untuk merencanakan harga saham dan kinerja keuangan dari waktu ke waktu untuk memilih portofolio yang memenuhi tujuan kinerja yang diharapkan. Dalam setiap proyek yang akan menghasilkan representasi visual data, muatan pertama adalah memastikan bahwa data dapat diandalkan dan bahwa konten memerlukan visual. Namun, dalam kasus



kami, memastikan bahwa data dapat diandalkan dan berguna telah dilakukan melalui tiga langkah pertama dari model IMPACT. Pada tahap ini dalam model IMPACT, menentukan metode untuk mengkomunikasikan hasil Anda membutuhkan jawaban atas dua pertanyaan: 1. Apakah Anda menjelaskan hasil analisis yang telah dilakukan sebelumnya, atau apakah Anda menjelajahi data melalui visualisasi? (Apakah tujuan Anda deklaratif atau eksploratif?) 2. Jenis data apa yang divisualisasikan (data konseptual, kualitatif atau data berbasis data, data kuantitatif)? Scott Berinato,editor senior di Harvard Business Review, merangkum kemungkinan jawaban atas pertanyaan-pertanyaan ini dalam bagan yang ditampilkan dalam Exhibit 4.2. Sebagian besar pekerjaan yang akan kita lakukan dengan hasil proyek analisis data akan berada di kuadran 2 dari Exhibit 4-2, kuadran deklaratif dan berbasis data. Kami juga akan melakukan sedikit pekerjaan di Kuadran 4-2 Pameran 4, kuadran eksplorasi berbasis data. Tidak ada banyak pekerjaan kualitatif yang harus dilakukan, meskipun kami akan bekerja dengan data kualitatif kategoris sesekali. Ketika kita bekerja dengan data kualitatif, itu akan paling sering divisualisasikan menggunakan alat di kuadran 1, kuadran konseptual deklaratif.



Setelah Anda mengetahui jawaban atas dua pertanyaan kunci dan telah menentukan kata-kata kasar quad mana yangAnda kerjakan, Anda dapat menentukan alat terbaik untuk pekerjaan itu. Apakah laporan tertulis dengan bagan sederhana cukup? Jika demikian, Word atau Excel sudah cukup. Apakah diperlukan dasbor interaktif dan laporan berulang? Jika demikian, Tableau mungkin alat yang lebih baik. Nantinya dalam bab ini, kita akan membahas dua alat ini secara lebih mendalam, bersama dengan kapan mereka harus digunakan. Kuadran 1 dan 3 versus Kuadran 2 dan 4: Kualitatif versus Kuantitatif Data kualitatif adalah data kategoris. Yang dapat Anda lakukan dengan data ini adalah menghitungnya dan mengelompokkannya, dan dalam beberapa kasus, Anda dapat menentukan peringkatnya. Data kualitatif dapat didefinisikan lebih lanjut dalam dua cara, data nominal dan data ordinal. Data nominal adalah bentuk data yang paling sederhana. Contoh data nominal adalah warna rambut, jenis kelamin, dan kelompok etnis. Jika Anda memiliki satu set data pada people dengan warna rambut yang berbeda, Anda dapat menghitung jumlah individu yang masuk ke dalam kategori warna rambut yang sama, tetapi



Anda tidak dapat menentukan peringkatnya (rambut coklat tidak lebih baik daripada rambut merah), Anda juga tidak dapat mengambil rata-rata atau melakukan perhitungan lebih lanjut lainnya di luar penghitungan (Anda tidak dapat mengambil rata-rata "pirang"). Peningkatan kompleksitas, tetapi masih dikategorikan sebagai data kualitatif, adalah data ordinal. Data ordinal juga dapat dihitung dan dikategorikan seperti data nominal tetapi dapat melangkah lebih jauh — kategori juga dapat diberi peringkat. Contoh data ordinal termasuk medali emas, perak, dan perunggu, 1-5 skala peringkat pada evaluasi guru, dan nilai huruf. Jika Anda memiliki satu set data siswa dan nilai surat yang telah mereka peroleh dalam kursus tertentu, Anda dapat menghitung jumlah contoh A, B, C, dan seterusnya, dan Anda dapat mengkategorikannya, seperti dengan data nominal. Anda juga dapat mengurutkan data secara bermakna — A lebih baik daripada B, yang lebih baik daripada C, dan seterusnya. Tapi itu sejauh yang Anda bisa mengambil perhitungan Anda - selama nilai tetap sebagai huruf (dan tidak berubah menjadi nilai numerik yang sesuai untuk setiap individu),Anda tidak dapat menghitungrata-rata, standar deviasi, atau perhitungan lain yang lebih kompleks. Selain menghitung dan mungkin menyortir (jika Anda memiliki data ordinal), statistik utama yang digunakan dengan data kuantitatif adalah proporsi. Proporsi dihitung dengan menghitung jumlah item dalam kategori tertentu, kemudian membagi angka itu dengan jumlah total pengamatan. Misalnya, jika saya memiliki dataset 150 orang dan memiliki cor masing-masing individu yang merespons warna rambut dengan25 orang dalam dataset saya memiliki rambut merah, saya dapat menghitung proporsi orang berambut merah dalam dataset saya dengan membagi 25 (jumlah orang dengan rambut merah) dengan 150 (jumlah total pengamatan dalam dataset saya). Proporsi orang berambut merah, kemudian, akan menjadi 16,7 persen. Data kualitatif (baik nominal maupun ordinal) juga dapat disebut sebagai data "konseptual" karena data tersebut didorong oleh teks dan mewakili konsep, bukan angka. Data kuantitatif lebih kompleks daripada data kualitatif karena tidak hanya dapat dihitung dan dikelompokkan seperti data kualitatif, tetapi perbedaan antara setiap titik data bermakna - ketika Anda mengurangi 4 dari 5, perbedaannya adalah ukuran numerik yang dapat dibandingkan dengan mengurangi 3 dari 5. Data kuantitatif terdiri dari pengamatan yang numerik dan dapat dihitung dan diberi peringkat, seperti data kualitatif ordinal, tetapi itu juga dapat di rata-rata. Standar deviasi dapat dihitung, dan dataset dapat dengan mudah dibandingkan ketika standar (jika ada). Bab 3 menyebutkan konsep distribusi normal dalam konteks profiling dalam audit berkelanjutan. Distribusi normal adalah fenomena yang diikuti oleh banyak dataset alami di dunia kita, seperti skor dan ketinggian SAT dan bobot bayi yang baru lahir. Agar distribusi data menjadi konsidid normal, data harus memiliki median, rata-rata, dan mode yang sama, dengan setengah dari pengamatan jatuh di bawah rata-rata dan setengah lainnya jatuh di atas rata-rata. Jika Anda membandingkan dua dataset yang mengikuti distribusi normal, bahkan jika kedua dataset memiliki cara yang sangat berbeda, Anda masih dapat membandingkannya dengan membakukan distribusi dengan skor Z. Dengan menggunakan rumus, Anda dapat mengubah setiap distribusi normal menjadi kasus khusus daridistribusi nor mal yang disebut distribusi normalstandar, yang memiliki 0 untuk rata-ratanya (dan dengan demikian, untuk mode dan mediannya, juga) dan 1 untuk standar deviasinya. Manfaat standarizing data Anda ketika membandingkan tidak lagi membandingkan angka yang sangat berbeda dan mencoba untuk bola mata bagaimana satu pengamatan berbeda dari yang lain-jika Anda membakukan kedua dataset, Anda dapat menempatkan kedua distribusi pada grafik yang sama dan lebih cepat datang ke wawasan Anda.



Mirip dengan data kualitatif, data kuantitatif dapat dikategorikan menjadi dua jenis yang berbeda: interval dan rasio. Namun, ada beberapa perselisihan di antara komunitas analitik tentang apakah perbedaan antara kedua dataset bermakna, dan demi analitik dan perhitungan yang akan Anda lakukan, perbedaannya tidak relevan. Data rasio dianggap sebagai jenis data yang paling canggih, dan cara paling sederhana untuk mengekspresikanperbedaanantara data interval dan rasio adalah bahwa data rasio memiliki data 0 dan interval yang berarti. Dengan kata lain, untuk data rasio, ketika dataset mendekati 0, 0 berarti "tidak adanya." Pertimbangkan uang sebagai data rasio - kita dapat memiliki 5 dolar, 72 dolar, atau 8.967 dolar, tetapi begitu kita mencapai 0, kita memiliki "tidak adanya" 0. Skala lain untuk data kuantitatif adalah data interval, yang tidak secanggih data rasio. Data interval tidak memiliki 0 yang berarti; Dengan kata lain, dalam data interval, 0 tidak berarti "tidak adanya" tetapi hanya angka lain. Contoh data interval adalah skala pengukuran suhu Fahrenheit, di mana 90 derajat lebih panas dari 70 derajat, yang lebih panas dari 0 derajat, tetapi 0 derajat tidak mewakili suhu "tidak adanya" - itu hanya angka lain pada skala. Data kuantitatif dapat dikategorikan lebih lanjut sebagai data diskrit atau kontinu. Data diskrit adalah data yang diwakili oleh bilangan bulat. Contoh data diskrit adalah poin dalam permainan bola basket — Anda bisa mendapatkan 2 poin, 3 poin, atau 157 poin, tetapi Anda tidak dapat memperoleh 3,5 poin. Di sisi lain, data kontinu adalah data yang dapat mengambil nilai apa pun dalam rentang. Contoh data kontinu adalah tinggi: Anda bisa 4,7 kaki, 5 kaki, atau 6,27345 kaki. Perbedaan antara data diskrit dan kontinu kadang-kadang bisa kabur karena Anda dapat mengekspresikan variabel diskrit sebagai kontinu - misalnya, jumlah anak-anak yang dapat dimiliki seseorang adalah diskrit (seorang wanita tidak dapat memiliki 2,7 anak, tetapi dia bisa memiliki 2 atau 3), tetapi jika Anda meneliti jumlah rata-rata anak-anak yang wanita berusia 25-40 memiliki di Amerika Serikat, rata-rata akan menjadi variabel terus menerus. Apakah data Anda diskrit atau kontinu juga dapat membantu Anda menentukan jenis grafik yang Anda buat karena data kontinu meminjamkan diri mereka lebih ke grafik garis daripada data diskrit. Kuadran 1 dan 2 versus Kuadran 3 dan 4: Deklaratif versus Eksploratif Dalam konteks laboratorium dan alat yang kami sediakan melalui buku teks ini, sebagian besar visualisasi data Anda yang dibuat pada langkah C dari model IMPACT akan dibuat dengan tujuan deklaratif. Visualisasi deklaratif adalah produk dari keinginan untuk "menyatakan" atau menyajikan temuan Anda kepada audiens. Proyek analisis data dimulai dengan pertanyaan, lanjutkan melalui analisis, dan diakhiri dengan mengkomunikasikan temuan tersebut. Ini berarti bahwa sementara visualisasi dapat mendorong percakapan dan perdebatan, informasi yang diberikan dalam grafik harus solid. Bahkan jika analisis Anda pada langkah-langkah sebelumnya dari model IMPACT telah eksplorasi, pada saat Anda telah tiba untuk mengkomunikasikan hasil Anda, Anda menyatakan apa yang telah Anda temukan. Di sisi lain, Anda kadang-kadang akan menggunakan visualisasi data untuk memenuhi tujuan visualisasi eksplorasi. Ketika ini dilakukan, garis antara langkah-langkah P (melakukan rencana tes), A (alamat dan memperbaiki hasil), dan C (hasil komunikasi) tidak jelas dibagi. Visualisasi data eksplorasi akan selaras dengan melakukan rencana pengujian dalam perangkat lunak visualisasi — misalnya, Tableau — dan mendapatkan wawasan saat Anda berinteraksi dengan data. Seringkali penyajian data eksplorasi akan dilakukan dalam pengaturan interaktif, dan jawaban atas pertanyaan dari langkah I



(mengidentifikasi pertanyaan) tidak akan terjawab sebelum bekerja dengan data dalam perangkat lunak visualisasi. Pameran 4-3 mirip dengan empat jenis bagan pertama yang disajikan kepada Anda di Pameran 4-2, tetapi Pameran 4-3 memiliki lebih banyak detail untuk membantu Anda menentukan apa yang harus dilakukan setelah Anda menjawab dua pertanyaan pertama. Ingat bahwa kuadran mewakili dua pertanyaan utama: 1. Apakah Anda menjelaskan hasil analisis yang dilakukan sebelumnya, atau apakah Anda menjelajahi data melalui visualisasi? (Apakah tujuan Anda deklaratif atau eksploratif?) 2. Jenis data apa yang divisualisasikan (data kualitatif konseptual atau data kuantitatif berbasis data)? Setelah Anda menentukan jawaban atas dua pertanyaan pertama, Anda siap untuk mulai menentukan jenis visualisasi mana yang paling tepat untuk tujuan dan dataset Anda.



4.2 MEMILIH BAGAN YANG TEPAT Setelah Anda menentukan jenis data yang bekerja dengan Anda dan tujuan visualisasi data Anda, pertanyaan berikutnya ada hubungannya dengan desain visualisasi — warna, font, grafik — dan yang paling penting, jenis bagan / grafik. Visual harus berbicara sendiri sebanyak yang diperlukan, tanpa perlu terlalu banyak penjelasan untuk apa yang diwakili. Bertujuan untuk kesederhanaan atas lonceng dan peluit yang "terlihat keren," tetapi akhirnya menjadi mengganggu. Bagan yang Sesuai untuk Data Kualitatif Karena data kualitatif dan kuantitatif memiliki tingkat kompleksitas dan kecanggihan yang berbeda, ada beberapa grafik yang tidak sesuai untuk data kualitatif yang bekerja untuk data kuantitatif. Ketika datang untuk secara visual mewakili data kualitatif, grafik yang paling sering dipertimbangkan untuk menggambarkan data kualitatif adalah: • Bagan batang. • Bagan pai. • Bagan batang bertumpuk.



Bagan pai mungkin adalah visualisasi data yang paling terkenal (beberapa orang mengatakan terkenal) untuk data kualitatif. Ini menunjukkan bagian-bagian dari keseluruhan; Dengan kata lain, ini mewakili proporsi setiap kategori karena sesuai dengan seluruh dataset. Demikian pula, bagan batang juga menunjukkan proporsi masing-masing kategori dibandingkan dengan yang lain. Dalam kebanyakan kasus, bagan batang lebih mudah ditafsirkan daripada bagan pai karena mata kita lebih terampil membandingkan ketinggian kolom (atau panjang batang horizontal, tergantung pada orientasi bagan Anda) daripada membandingkan ukuran pai, terutama jika proporsinya relatif mirip. Pertimbangkan dua grafik yang berbeda dari dataset Sláinte di Exhibit 4-4. Masingmasing membandingkan proporsi setiap jenis bir yang dijual oleh tempat pembuatan bir. Besarnya perbedaan antara Imperial Stout dan IPA hampir tidak mungkin dilihat dalam bagan pai. Perbedaan ini lebih mudah dicerna dalam bagan batang. Tentu saja, kita dapat meningkatkan bagan pai dengan menambahkan persentase yang terkait dengan setiap proporsi, tetapi jauh lebih cepat bagi kita untuk melihat perbedaan proporsidengan melirik urutan dan panjang bar dalam bagan batang (Pameran 4-5).



Kumpulan data yang sama juga dapat diwakili dalam bagan batang bertumpuk atau bagan batang bertumpuk 100 persen (Pameran 4-6). Bagan ini bukan opsi default di Excel, tetapi berfungsi di alat visualisasi data lain yang kami perkenalkan nanti di bab ini, Tableau. Angka pertama dalam Pameran 4-6 adalah bagan batang bertumpuk, yang menunjukkan proporsi setiap jenis bir yang dijual yang dinyatakan dalam jumlah bir yang dijual untuk setiap produk, sementara yang terakhir menunjukkan proporsi yang dinyatakan dalam hal persentase keseluruhan dalam bagan batang bertumpuk 100 persen. Sementara grafik batang dan bagan pai adalah salah satu grafik yang paling umum digunakan untuk data kualitatif, ada beberapa grafik lain yang berfungsi dengan baik untuk menunjukkan proporsi: Peta pohon dan peta panas: Ini adalah jenis visualisasi yang serupa, dan keduanya menggunakan ukuran dan warna untuk menunjukkan ukuran nilai yang proporsional. Sementara peta pohon menunjukkan proporsi menggunakan ruang fisik, peta panas menggunakan warna untuk



menyoroti skala nilai. Namun, keduanya sangat visual, sehingga mereka tidak sempurna untuk situasi di mana ketepatan angka atau proporsi yang diwakili diperlukan. Peta simbol: Peta simbol adalah peta geografis, sehingga harus digunakan ketika mengekspresikan proporsi data kualitatif di seluruh wilayah geografis seperti negara bagian atau negara. • Awan Word: Jika Anda bekerja dengan data teks, bukan data kategoris, Anda dapat mewakilinya di cloud kata. Awan word terbentuk dengan menghitung frekuensi setiap kata yang disebutkan dalam dataset; Semakin tinggi frekuensi (proporsi) dari kata tertentu, semakin besar dan lebih berani font untuk kata itu dalam kata awan. Pertimbangkan untuk menganalisis hasil pertanyaan respons terbuka pada survei; Awan kata akan menjadi cara yang bagus untuk dengan cepat menemukan kata-kata yang paling umum digunakan untuk mengetahui apakah ada perasaan positif atau negatif terhadap apa yang sedang disurvei. Ada juga pengaturan yang dapat Anda tempatkan saat membuat kata cloud untuk meninggalkan kata-kata bahasa Inggris yang paling umum digunakan — seperti, an, dan a — agar tidak membelokkan data. Pameran 47 adalah contoh awan kata untuk teks bab 2 dari buku teks ini



Bagan yang Sesuai untuk Data Kuantitatif Visualisasi data dan kemungkinan grafik untuk memetakan data kuantitatif mirip dengan bagaimana data kuantitatif memiliki karakteristik data kualitatif yang sama (Anda dapat mengelompokkan dan menghitungnya), tetapi mereka memiliki kecanggihan yang lebih banyak. Anda dapat menggunakan bagan pai (dengan tingkat keberhasilan yang berbeda yang sama) dan bagan batang dengan data kuantitatif, tetapi Anda juga dapat menggunakan lebih banyak. Ada banyak metode berbeda untuk memvisualisasikan data kuantitatif. Dengan pengecualian kata cloud, semua metode yang disebutkan di bagian sebelumnya untuk data kualitatif dapat bekerja untuk menggambarkan data kuantitatif, tetapi grafik berikut dapat menggambarkan data yang lebih kompleks: Bagan garis: Tampilkan informasi serupa dengan apa yang ditunjukkan bagan batang, tetapi bagan garis bagus untuk menampilkan perubahan data atau garis tren dari waktu ke waktu. Bagan garis berguna untuk data kontinu, sedangkan bagan batang sering digunakan untuk data diskrit. Untuk alasan itu, grafik garis tidak direkomendasikan untuk data kualitatif, yang secara alami kategoris, tidak pernah bisa terus menerus. • Plot kotak dan kumis: Berguna ketika kuartil, median, dan outlier diperlukan untuk analisis dan wawasan. Scatter plot: Berguna untuk mengidentifikasi korelasi antara dua variabel atau untuk mengidentifikasi garis tren atau garis yang paling cocok. Peta geografis yang terisi: Berbeda dengan peta simbol, peta geografis yang diisi digunakan untuk menggambarkan rentang data untuk data kuantitatif di berbagai wilayah geografis seperti negara bagian atau negara. Ringkasan tipe bagan yang baru saja dijelaskan muncul di Pameran 4-8. Setiap opsi bagan bekerja sama baiknya untuk visualisasi data eksplorasi dan deklaratif. Jenis bagan dikategorikan berdasarkan kapan mereka akan paling baik digunakan (misalnya, ketika membandingkankemampuan varikualitatif, bagan batang adalah pilihan optimal), tetapi angka ini tidak boleh digunakan untuk menahan kreativitas — bagan batang juga dapat digunakan untuk menunjukkan perbandingan di antara variabel kuantitatif, sama seperti banyak grafik dalam kategori yang terdaftar dapat bekerja dengan baik dengan tipe data dan tujuan lain daripada kategorisasi utama mereka di bawah ini.



Seperti halnya memilih dan menyempurnakan model analitis Anda, mengkomunikasikan hasil lebih banyak seni daripada sains. Setelah Anda terbiasa dengan alat yang tersedia, tujuan Anda harus selalu berbagi informasi penting dengan para pemangku kepentingan dengan cara yang jelas dan ringkas. Sementara visualisasi bisa sangat berdampak, mereka bisa menjadi gangguan jika Anda tidak berhati-hati. Misalnya, grafik batang dapat dimanipulasi untuk menunjukkan bias dan, sementara novel, grafik 3D sangat menipu karena dapat mendistorsi skala bahkan jika jumlahnyaadalah grafik. Alat untuk Membantu Saat Memilih Visual Ada banyak alat yang tersedia untuk visualisasi data dan analisis data eksplorasi. Gartner setiap tahun menilai koleksi alat-alat ini dan menciptakan "kuadran ajaib" untuk intelijen bisnis, yang digambarkan dalam Exhibit 4-9. Kuadran ajaib dapat memberikan wawasan tentang alat mana yang harus Anda pertimbangkan untuk digunakan.



Berdasarkan kuadran Gartner, mudah untuk melihat bahwa Tableau dan Microsoft adalah dua opsi terbaik dan paling populer yang tersedia, dan ini adalah dua alat yang akan kami fokuskan juga. Alat Microsoft yang dianalisis dan dibandingkan dengan produk lain bukan hanya Excel, itu termasuk seluruh suite Microsoft BI, di mana Excel hanya bagian. Kami akan fokus pada Excel sebagai pendorong utama toolkit Microsoft dalam teks ini. Tableau berada di peringkat sedikit lebih tinggi dari Microsoft pada kemampuannya untuk mengeksekusi, sementara Microsoft peringkat sedikit lebih tinggi dari Tableau dalam kelengkapan visi. Perbedaan ini masuk akal karena Tableau adalah produk yang lebih baru dan telah menempatkan sebagian besar fokusnya pada visualisasi data, sementara Microsoft Excel memiliki platform yang jauh lebih kuat untuk analisis data. Keuntungan terbesar Excel atas Tableau (dan lebih dari perangkat lunak visualisasi data lainnya di pasar) adalah keberadaannya. Excel telah berada di pasar lebih lama daripada pesaingnya, dan jarang menemukan bisnis atau universitas yang tidak memiliki versi Excel di setiap komputer. Jika proyek analisis data Anda



lebih deklaratif daripada eksplorasi, kemungkinan besar Anda akan melakukan visualisasi data untuk mengkomunikasikan hasil di Excel, hanya karena kemungkinan Anda melakukan langkah 2 hingga 4 di Excel, dan lebih mudah untuk membuat bagan Anda dengan alat yang sama dengan yang Anda lakukan analisis. Tableau mendapatkan pujian tinggi karena intuitif dan mudah digunakan, yang membuatnya ideal untuk analisis dataeksplorasi. Anda bahkan mungkin menemukan bahwa Anda lebih suka untuk segera memuat data Anda dari Excel atau Access (atau di mana pun data Anda disimpan) ke Tableau selamalangkah second dari model IMPACT dan mengerjakan analisis Anda di dalam alat, daripada menunggu langkah 5 untuk hanya mengkomunikasikan hasil Anda melalui Tableau. Jika pertanyaan Anda tidak sepenuhnya didefinisikan atau spesifik, menjelajahi dataset Anda di Tableau dan mengubah jenis visualisasi Anda untuk menemukan wawasan yang berbeda adalah bagian dari melakukan analisis data seperti menyusun komunikasi Anda. Salah satu kelemahan terbesar tableau adalah biayanya, tetapi untungnya, Tableau adalah pendukung pendidikan yang luar biasa, dan sebagai siswa, Anda dapat mengunduh lisensi akademik gratis untuk menggunakan Tableau di PC atau Mac Anda. Tautan untuk mengunduh lisensi tableau gratis Anda adalah: https://www.tableau.com/academic/students. Setelah Anda mengunduh lisensi Anda, kami sarankan membuka buku kerja sampel Superstore yang disediakan. Anda akan menemukannya di bagian bawah layar mulai di bawah "Contoh buku kerja" (Pameran 410). Setelah Anda membuka buku kerja, Anda akan melihat berbagai tab di bagian bawah buku kerja yang dapat Anda lewati dan melihat berbagai cara agar kumpulan data yang sama dapat dianalisis dan divisualisasikan. Ketika Anda melakukan analisis eksplorasi di Tableau, atau bahkan jika Anda telah melakukan



Analisis Anda dan Anda telah mengunggah dataset ke Tableau untuk mengkomunikasikan wawasan, kami sarankan mencoba beberapa jenis bagan yang berbeda untuk melihat mana yang membuat wawasan Anda menonjol paling efektif. Di sudut kanan atas buku kerja Tableau, Anda akan melihat jendela Perlihatkan Saya, yang menyediakan opsi berbeda untuk memvisualisasikan dataset Anda (Pameran 4-11).



Di tab Perlihatkan Saya, hanya visualisasi yang akan berfungsi untuk dataset khusus Anda yang akan muncul dalam warna penuh. Belajar Membuat Bagan yang Baik dengan (Buruk) Contoh Selain berlatih dengan melihat visualisasi yang baik dan memodifikasi cara Anda memvisualisasikan dataset Anda di Tableau untuk melihat bagaimana wawasan yang berbeda dipamerkan, salah satu cara terbaik untuk belajar bagaimana membuat visualisasi yang baik adalah dengan melihat beberapa visualisasi bermasalah. Dalam bagan ini, Daily Mail, sebuah surat kabar yang berbasis di Inggris, mencoba untuk menekankan peningkatan perkiraan pertumbuhan ekonomi Inggris. Perkiraan dari Kantor Statistik Nasional menunjukkan bahwa pertumbuhan Q4 akan menjadi 0,7 persen, bukan 0,6 persen (peningkatan yang relatif kecil sekitar 15 persen). Namun visualisasi membuatnya tampak seolah-olah ini adalah peningkatan 200 persen karena skala yang dipilih surat kabar. Masalah lain yang jelas adalah bahwa beberapa waktu telah berlalu antara perkiraan, dan kami tidak melihat yang diungkapkan di sini (Pameran 4-12)



Jika kita mengerjakan ulang titik data untuk menunjukkan skala yang benar (mulai dari 0, bukan 0,55) dan perubahan dari waktu ke waktu (merencanakan data di sepanjang sumbu horizontal), kita akan melihat sesuatu seperti Pameran 4-13. Jika kita ingin menekankan pertumbuhan, kita mungkin memilih grafik seperti Exhibit 4-14. Perhatikan bahwa kedua grafik baru menunjukkan peningkatan yang kurang dramatis dan membingungkan



Jika Anda ingin menekankan pengguna, pertimbangkan bagan batang yang dipesan peringkat seperti Pameran 4-16. Untuk menekankan kategori, perbandingan seperti itu di Pameran 4-17 dapat membantu. Atau untuk menunjukkan proporsi, mungkin bar bertumpuk (Pameran 4-18). Bagaimanapun, ada cara yang jauh lebih baik untuk berkomunikasi dengan jelas.



4.3 LEBIH LANJUT MENYEMPURNAKAN BAGAN ANDA UNTUK BERKOMUNIKASI LEBIH BAIK Setelah mengidentifikasi tujuan visualisasi Anda dan jenis visual mana yang paling efektif dalam mengkomunikasikan hasil Anda, Anda perlu lebih menyempurnakan bagan Anda untuk memilih skala, warna, dan format data yang tepat. Skala dan Peningkatan Data Karena alat seperti Excel dan Tableau menjadi lebih intuitif dan lebih kuat, mengingat skala dan peningkatan data Anda kurang menjadi perhatian karena kedua alat umumnya akan menghasilkan skala dan peningkatan yang masuk akal untuk dataset Anda. Dengan itu dikatakan, masih ada empat pertanyaan utama yang perlu dipertimbangkan ketika membuat skala dan peningkatan data Anda: 1. Berapa banyak data yang perlu Anda bagikan dalam visual untuk menghindari menyesatkan, namun juga menghindari gangguan? (Misalnya, apakah Anda perlu menampilkan empat tahun terakhir, atau akankah dua kuartal terakhir cukup? Ketika Anda mempertimbangkan untuk meninggalkan beberapa data, apakah itu hanya untuk menunjukkan wawasan yang bermakna, atau apakah itu upaya untuk membelokkan data atau menyembunyikan kinerja yang buruk? Berhati-hatilah untuk tidak menyembunyikan data yang bermakna hanya karena mereka tidak selaras dengan harapan Anda. 2. Jika data Anda mengandung outlier, haruskah mereka ditampilkan, atau akankah mereka mendistorsi skala Anda sejauh Anda dapat meninggalkannya? Jika tujuan bagan Anda adalah untuk menarik perhatian pada outlier, maka mereka harus tetap (dan Anda perlu memastikan bahwa mereka bukan kesalahan, tetapi ini seharusnya dilakukan pada langkah 2 dari model IMPACT ketika Anda menguasai data). Jika tujuan bagan Anda adalah untuk menampilkan paket tengah data, outlier mungkin tidak relevan dengan wawasan, dan mereka dapat ditinggalkan.



3. Selain menentukan berapa banyak data yang perlu Anda bagikan, skala apa yang harus Anda tempatkan pada data tersebut? Biasanya, grafik harus dimulai dengan garis dasar 0, tetapi jika 0 tidak ada artinya untuk dataset Anda, Anda dapat menemukan garis dasar yang berbeda yang masuk akal. Berhati-hatilah untuk tidak terlalu memaksakan ketinggian atau garis dasar sehingga grafik tren atau bar Anda berakhirataukurang ditekankan; garis tren Anda harus mengambil dua pertiga dari grafik. Setelah Anda memutuskan skala data, kenaikan untuk skala data Anda harus "alami" seperti 1s, 2s, 5s, 100s, dll (misalnya, bukan 3s atau 0,02s). 4. Apakah Anda perlu memberikan konteks atau titik referensi untuk membuat skala bermakna? Misalnya, jika Anda diberi harga saham 100, apakah Anda akan segera dapat mengetahui apakah itu angka tinggi atau angka rendah? Belum tentu; Tanpa konteks harga saham perusahaan dari waktu ke waktu, industri perusahaan dan harga saham pesaingnya, atau beberapa bagian konteks lainnya, angkaangka tertentu sama sekali tidak berguna. Warna Mirip dengan bagaimana Excel dan Tableau telah menjadi alat yang lebih kuat dalam memilih skala dan peningkatan data yang sesuai, Excel dan Tableau akan memiliki tema warna default saat Anda mulai membuat visualisasi data Anda. Anda dapat memilih untuk menyesuaikan tema. Namun, jika Anda melakukannya, berikut adalah beberapa poin yang perlu dipertimbangkan: • Kapan Anda harus menggunakan beberapa warna? Menggunakan beberapa warna untuk membedakan jenis data adalah efektif. Menggunakan warna yang berbeda untuk menyoroti titik fokus juga efektif. Namun, jangan gunakan beberapa warna untuk mewakili jenis data yang sama. Berhatihatilah untuk tidak menggunakan warna untuk membuat bagan terlihat cantik — inti visualisasinya adalah menampilkan wawasan dari data Anda, bukan untuk membuat seni. Kita dilatih untuk memahami perbedaan antara merah, kuning, dan hijau, dengan warna merah yang berarti sesuatu yang negatif yang ingin kita "hentikan" dan hijau menjadi sesuatu yang positif yang ingin kita "lanjutkan," seperti halnya lampu lalu lintas. Oleh karena itu, gunakan merah dan hijau hanya karena alasan itu. Menggunakan warna merah untuk menunjukkan sesuatu yang positif atau hijau untuk menunjukkan sesuatu yang negatif adalah berlawanan dengan intuisi dan akan membuat grafik Anda lebih sulit dipahami. Anda mungkin juga ingin mempertimbangkan audiens buta warna. Jika Anda khawatir bahwa seseorang yang membaca visual Anda mungkin buta warna, hindari skala merah / hijau dan pertimbangkan untuk menggunakan oranye / biru. Tableau telah mulai default ke sisik warna oranye / biru bukan merah / hijau untuk alasan ini. • Setelah bagan Anda dibuat, ubah menjadi skala abu-abu untuk memastikan bahwa kontras masih ada — ini baik untuk memastikan audiens buta warna Anda dapat menafsirkan visual Anda dan juga untuk memastikan bahwa kontras, secara umum, cukup mencolok dengan palet warna yang telah Anda pilih. KOMUNIKASI: LEBIH DARI VISUAL - MENGGUNAKAN KATA-KATA UNTUK MEMBERIKAN WAWASAN Sebagai seorang mahasiswa, sebagian besar tulisan yang Anda lakukan adalah untuk profesor Anda. Anda mungkin menulis e-mail kepada profesor Anda, yang harus membawa nada hormat, atau esai untuk Comp 1 atau profesor sastra Anda, di mana Anda mungkin telah didorong untuk menggunakan bahasa deskriptif dan nada tinggi; Anda bahkan mungkin memiliki kesempatan untuk menulis ringkasan bisnis atau melaporkan untuk profesor bisnis Anda. Namun, sementara itu, Anda masih sadar bahwa



Anda sedang menulis untuk seorang profesor. Ketika Anda memasuki dunia profesional, tulisan Anda perlu mengambil nada yang berbeda. Jika Anda terbiasa menulis dengan nada akademis, transisi ke menulis untuk rekan kerja Anda dalam pengaturan bisnis membutuhkan beberapa praktik. Seperti yang dikatakan Justin Zobel dalam Menulis untuk Ilmu Komputer, "gaya yang baik untuk sains pada akhirnya, tidak lebih dari menulis yang mudah dimengerti. [Ini harus] jelas, tidak ambigu, benar, menarik, dan langsung. " Sebagai tim penulis, kami sangat menghormati sastra dan gaya penulisan yang berbeda dapat ditemukan, tetapi untuk mengkomunikasikan hasil Proyek analisis data Anda, Anda perlu menulis langsung kepada audiens Anda, dengan hanya poin yang diperlukan yang disertakan, dan sesedikit mungkin gaya deskriptif. Intinya adalah, sampai ke intinya. Konten dan Organisasi Setiap langkah dari model IMPACT harus dikomunikasikan dalam artikel Anda, seperti yang dicatat di sini: I: Jelaskan apa yang sedang diteliti. Bahkan jika audiens Anda adalah orang-orang yang meminta penelitian, Anda masih harus menyatakan kembali tujuan proyek. Sertakan juga sejarah yang relevan. Jika proyek Anda adalah bagian dari program yang lebih besar atau jika itu adalah upaya lanjutan untuk menjelaskan masalah atau membantu keputusan membuahkan hasil, maka sertakan latar belakang. M: Tergantung pada audiens Anda, Anda mungkin tidak mencakup terlalu banyak dari apa proses Anda dalam langkah "menguasai data" dari model IMPACT, tetapi gambaran umum dari sumber data dan potongan data mana yang termasuk dalam analisis harus ada. Jika audiens Anda teknis dan tertarik, Anda dapat menjelaskan secara rinci tentang proses ETL Anda, tetapi kemungkinan besar Anda akan meninggalkan bagian itu. P dan A: Mirip dengan bagaimana Anda menulis tentang menguasai data, Anda mungkin tidak perlu menyertakan deskripsi menyeluruh tentang rencana pengujian Anda atau proses Anda untuk menyempurnakan hasil Anda tergantung pada apa yang diminati audiens Anda dan apa yang perlu mereka ketahui, tetapi termasuk ikhtisar jenis analisis yang dilakukan dan batasan apa pun yang Anda temui akan penting untuk disertakan. C: Jika Anda menyertakan visualisasi data dengan artikel Anda, Anda perlu menjelaskan cara menggunakan visual. Jika ada aspek-aspek tertentu yang Anda harapkan untuk menonjol dari analisis dan visual yang menyertainya, Anda harus menjelaskan apa komponen-komponen itu - visual harus berbicara untuk dirinya sendiri, tetapi artikel dapat memberikan konfirmasi bahwa potongan-potongan penting diperoleh. T: Diskusikan apa yang berikutnya dalam analisis Anda. Akankah laporan visual atau laporan menghasilkan laporan mingguan atau triwulanan? Tren atau outlier apa yang harus diperhatikan dari waktu ke waktu? Penonton dan Nada Hati-hati mempertimbangkan audiens Anda sangat penting untuk memastikan komunikasi Anda efektif. Jika Anda memiliki tiga pesan untuk ditulis - satu membiarkan ibu Anda tahu bahwa Anda akan pulang akhir pekan ini dan Anda harus mencuci pakaian, satu ke profesor Anda memberi tahu dia bahwa Anda akan melewatkan kelas pada hari Jumat, dan satu untuk teman terbaik Anda bertanya apakah dia ingin



bergabung dengan Anda untuk Chipotle - efisiensi akan menyarankan agar Anda mengetik semuanya menjadi satu email dan klik kirim. Itu pasti akan menjadi cara tercepat untuk mengeluarkan pesan. Tapi apakah itu ide yang bagus? Tentu saja tidak. Ibu Anda tidak perlu tahu bahwa Anda tidak akan pergi ke kelas pada hari Jumat, dan Anda mungkin tidak ingin profesor Anda muncul di Chipotle untuk makan siang bersama Anda dan teman Anda. Alih-alih mengirim pesan yang sama ke ketiga orang tersebut, Anda menyesuaikan pengiriman — yaitu, Anda mempertimbangkan audiens. Anda menyertakan semua informasi yang perlu mereka ketahui dan tidak ada yang lain. Anda harus melakukan hal yang sama ketika menyusun komunikasi Anda mengenai analisis data Anda. Jika Anda memiliki beberapa orang yang berbeda untuk mengkomunikasikan hasil, Anda dapat mempertimbangkan untuk membuat beberapa versi yang berbeda: yang berisi semua detail ekstraksi, transformasi, dan pemuatan (ETL) untuk programmer dan administrator basis data, yang ringan pada ETL tetapi berat pada interpretasi visual dan hasil untuk manajer Anda, dan sebagainya. Pertimbangkan pengetahuan dan keterampilan audiens Anda — jangan berbicara kepada mereka, tetapi jangan membanjiri kerumunan nonteknis dengan jargon teknis. Jelaskan dasar-dasarnya kapan Anda harus, dan jangan ketika Anda tidak seharusnya. Merevisi Sama seperti Anda membahas dan menyempurnakan hasil Anda di langkah keempat dari model IMPACT, Anda harus memperbaiki tulisan Anda. Sampai Anda mendapatkan banyak latihan (dan bahkan setelah Anda menganggap diri Anda seorang ahli), Anda harus meminta orang lain untuk membaca tulisan Anda untuk memastikan bahwa Anda berkomunikasi dengan jelas. Justin Zobel menyarankan bahwa merevisi tulisan Anda mengharuskan Anda untuk "tidak egois — siap untuk tidak menyukai apa pun yang telah Anda tulis sebelumnya. . . Jika seseorang tidak menyukai sesuatu yang telah Anda tulis, ingatlah bahwa itu adalah pembaca yang perlu Anda sukai, bukan diri Anda sendiri. Selalu menempatkan audiens Anda sebagai fokus tulisan Anda akan membantu Anda mempertahankan nada yang tepat, memberikan konten yang tepat, dan menghindari terlalu banyak detail.



RINGKASAN 











Bab ini berfokus pada langkah kelima dari model IMPACT, atau "C," untuk membahas bagaimana mengkomunikasikan hasil proyek analisis data Anda. Komunikasi dapat dilakukan melalui berbagai visualisasi data dan laporan tertulis, tergantung pada audiens Anda dan data yang Anda tunjukkan. Untuk memilih bagan yang tepat, Anda harus terlebih dahulu menentukan tujuan visualisasi data Anda. Hal ini dapat dilakukan dengan menjawab dua pertanyaan kunci: Apakah Anda menjelaskan hasil analisis yang dilakukan sebelumnya, atau apakah Anda menjelajahi data melalui visualisasi? (Apakah tujuan Anda deklaratif atau eksploratif?) ◦ Jenis data apa yang divisualisasikan (data kualitatif konseptual atau datatitatif quanberbasis data)? Perbedaan antara setiap jenis data (deklaratif dan eksploratif, kualitatif dan kuantitatif) dijelaskan, serta bagaimana setiap datatype berdampak pada alat yang mungkin Anda gunakan (umumnya Excel atau Tableau) dan bagan yang harus Anda buat.











Setelah memilih bagan yang tepat berdasarkan tujuan dan tipe data Anda, bagan Anda perlu disempurnakan lebih lanjut. Memilih skala data yang sesuai, penambahan skala, dan warna untuk visualisasi Anda dijelaskan melalui jawaban atas pertanyaan-pertanyaan berikut: Berapa banyak data yang perlu Anda bagikan dalam visual untuk menghindari menyesatkan, namun juga menghindari gangguan? Jika data Anda mengandung outlier, haruskah mereka ditampilkan, atau akankah mereka mendistorsi skala Anda sejauh Anda dapat meninggalkannya? ◦ Selain berapa banyak data yang perlu Anda bagikan, skala apa yang harus Anda tempatkan pada data tersebut? Apakah Anda perlu memberikan konteks atau titik referensi untuk membuat skala bermakna? ◦ Kapan Anda harus menggunakan beberapa warna? Akhirnya, bab ini membahas cara memberikan laporan tertulis untuk menggambarkan proyek analisis data Anda. Setiap langkah dari model IMPACT harus dikomunikasikan dalam artikel Anda, dan laporan harus disesuaikan dengan audiens tertentu kepada siapa itu disampaikan.



KATA KUNCI data kontinu (142) Salah satu cara untuk mengkategorikan data kuantitatif, sebagai lawan dari data diskrit. Data kontinu dapat mengambil nilai apa pun dalam rentang. Contoh data kontinu adalah tinggi. Visualisasi deklaratif (143) Dibuat ketika tujuan proyek Anda adalah untuk "menyatakan" atau menyajikan temuan Anda kepada audiens. Grafik yang deklaratif biasanya dibuat setelah analisis data selesai dan dimaksudkan untuk menunjukkan apa yang ditemukan dalam langkah-langkah analisis. Data diskrit (142) Salah satu cara untuk mengkategorikan data kuantitatif, sebagai lawan dari data kontinu. Data diskrit diwakili oleh bilangan bulat. Contoh data diskrit adalah poin dalam permainan bola basket. Visualisasi eksplorasi (143) Dibuat ketika garis antara langkah-langkah P (melakukan rencana tes), A (alamat dan memperbaiki hasil), dan C (hasil komunikasi) tidak jelas dibagi seperti dalam proyek visualisasi deklaratif. Seringkali ketika Anda menjelajahi data dengan visualisasi, Anda melakukan rencana pengujian langsung dalam perangkat lunak visualisasi seperti Tableau alih-alih membuat bagan setelah analisis dilakukan. data interval (142) Jenis data ketiga yang paling canggih pada skala nominal, ordinal, interval, dan rasio; jenis data kuantitatif. Data interval dapat dihitung dan dikelompokkan seperti data kualitatif, dan perbedaan antara setiap titik data bermakna. Namun, data interval tidak memiliki 0 yang berarti. Dalam data interval, 0 tidak berarti "tidak adanya" tetapi hanya angka lain. Contoh data interval adalah skala pengukuran suhu Fahrenheit. Data nominal (141) Jenis data yang paling tidak canggih pada skala nominal, ordinal, interval, dan rasio; jenis data kualitatif. Satu-satunya hal yang dapat Anda lakukan dengan data nominal adalah menghitung, mengelompokkan, dan mengambil proporsi. Contoh data nominal adalah warna rambut, jenis kelamin, dan kelompok etnis.



Distribusi normal (142) Jenis distribusi di mana median, rata-rata, dan mode semuanya sama, sehingga setengah dari semua pengamatan jatuh di bawah rata-rata dan setengah lainnya jatuh di atas rata-rata. Fenomena ini terjadi secara alami di banyak dataset di dunia kita, seperti skor SAT dan ketinggian dan berat bayi yang baru lahir. Ketika dataset mengikuti distribusi normal, mereka dapat distandarisasi dan dibandingkan untuk analisis yang lebih mudah. Data ordinal (141) Jenis data paling canggih kedua pada skala nominal, ordinal, interval, dan rasio; jenis data kualitatif. Ordinal dapat dihitung dan dikategorikan seperti data nominal dan kategori juga dapat diberi peringkat. Contoh data ordinal termasuk medali emas, perak, dan perunggu. proporsi (141) Statistik utama yang digunakan dengan data kuantitatif. Proporsi dihitung dengan menghitung jumlah item dalam kategori tertentu, kemudian membagi angka itu dengan jumlah total pengamatan. data kualitatif (141) Data kategoris. Yang dapat Anda lakukan dengan data ini adalah hitungan dan grup, dan dalam beberapa kasus, Anda dapat menentukan peringkat data. Data kualitatif dapat didefinisikan lebih lanjut dalam dua cara: data nominal dan data ordinal. Tidak ada banyak pilihan untuk memetakan data kualitatif karena mereka tidak secanggih data kuantitatif. Data kuantitatif (142) Lebih kompleks dari data kualitatif. Data kuantitatif dapat didefinisikan lebih lanjut dalam dua cara: interval dan rasio. Dalam semua data kuantitatif, interval antara titik data bermakna, memungkinkan data tidak hanya dihitung, dikelompokkan, dan diberi peringkat, tetapi juga untuk memiliki operasi yang lebih kompleks yang dilakukan pada mereka seperti rata-rata, median, dan standar deviasi. Data rasio (142) Jenis data yang paling canggih pada skala nominal, ordinal, interval, dan rasio; jenis data kuantitatif. Mereka dapat dihitung dan dikelompokkan seperti data kualitatif, dan perbedaan antara setiap titik data bermakna seperti dengan data interval. Selain itu, data rasio memiliki 0 yang berarti. Dengan kata lain, begitu dataset mendekati 0, 0 berarti "tidak adanya." Contoh data rasio adalah mata uang. distribusi normal standar (142) Kasus khusus dari distribusi normal yang digunakan untuk standarisasi data. Distribusi normal standar memiliki 0 untuk rata-ratanya (dan dengan demikian, untuk mode dan mediannya, juga), dan 1 untuk standar deviasinya. Metode yang digunakan untuk membandingkan dua dataset yang mengikuti distribusi normal. Dengan menggunakan rumus, setiap distribusi normal dapat diubah menjadi distribusi normal standar. Jika Anda membakukan kedua dataset, Anda dapat menempatkan kedua distribusi pada grafik yang sama dan lebih cepat datang ke wawasan Anda.