Statistik Vs Data Mining [PDF]

  • 0 0 0
  • Suka dengan makalah ini dan mengunduhnya? Anda bisa menerbitkan file PDF Anda sendiri secara online secara gratis dalam beberapa menit saja! Sign Up
File loading please wait...
Citation preview

Statistik vs Data Mining Selama bertahun tahun statistik merupakan alat bantu yang ‘handal’ bagi para ilmuwan. Statistik sudah ada sejak abad 19 dan berdasarkan formulasi dasar matematika untuk menguji generalisasi dari hipotesa ‘sedikit’ data sample terhadap populasi yang diteliti. Selama bertahun tahun pula statistik berhadapan dengan isu mengenai terlalu sedikitnya data yang tersedia, sehingga kita harus mampu mengambil kesimpulan global dari sedikit data tersebut dengan tingkat kepercayaan yang tinggi, isu ini juga diakibatkan karena jaman dahulu mencari data ukuran besar itu mahal. Statistik mempunyai ciri khas mengkonfirmasi dugaan, data numerik, dan hanya menyelesaikan masalah terstruktur. Demikian juga dibidang bisnis dan ilmu sosial, pada umumnya masalah disederhanakan sedemikian rupa sehingga bisa diukur secara statistik. Data Mining merupakan alat untuk menemukan pengetahuan di dalam data berdasarkan pola yang ada di dalam data tersebut. Data Mining muncul baru akhir akhir ini, seiring dengan tersedianya data berukuran besar di internet dan sosial media. Data Mining dalam skala besar disebut juga sebagai Big Data, karena fungsinya sama yaitu memperoleh pengetahuan dari data, kemudian dibuat modelnya untuk memprediksi, mengoptimasi dan membantu pengambilan keputusan bisnis. Data Mining menyediakan banyak algoritma untuk menangani data komples dalam menyelesaikan persoalan kompleks (contohnya jumlah variabel data yang banyak). Jelas, Data Mining mempunyai sedikit keunggulan karena mampu melakukan ‘prediksi’ dibandingkan dengan statistik yang hanya melakukan ‘konfirmasi’ hipotesa. Sayangnya di Indonesia, Data Mining merupakan ‘domain’ dari orang orang IT. Rekan rekan dari ilmu sosial/bisnis jarang sekali menggunakan alat ini, padahal data data dari sosial media sungguh berlimpah dan sangat banyak pertanyaan pertanyaan dalam bisnis yang bisa dibantu dengan alat ini.



Statistika vs Data Mining vs Machine Learning vs Artificial Intelligence Di dunia data, ada beberapa istilah yang mirip namun mereka sebenarnya berbeda. Jika kita ingin mengetahui perbedaaannya, maka kita dengarkan saja definisi menurut para ahli. Kali ini akan dibahas beberapa istilah seperti statistika, data mining, machine learning dan artificial intelligence.



DATA MINING



Cara pandang dan pengetahuan yang berbeda membuat para ahli memberikan definisi berbeda mengenai Data Mining. Sebagian ahli mengatakan bahwa Data Mining adalah langkah analisis terhadap proses penemuan pengetahuan di dalam basis data (Fayyad et al. 1996). Data Mining merupakan gabungan sejumlah disiplin ilmu komputer (ACM 2006), (Clifton 2010), yang didefinisikan sebagai proses penemuan pola baru dari kumpulan data yang sangat besar, meliputi metode-metode yang merupakan irisan dari artificial intelligence,machine learning, statistics, dan database systems. Data Mining ditujukan untuk mengekstrak (mengambil intisari) pengetahuan dari sekumpulan data sehingga didapatkan struktur yang dapat dimengerti manusia serta meliputi basis data dan management data, prapemrosesan data, pertimbangan model dan inferensi, ukuran ketertarikan, pertimbangan kompleksitas, pascapemrosesan terhadap struktur yang ditemukan, visualisasi, dan online updating. MACHINE LEARNING



Metode ini membuat mesin bisa belajar sendiri tanpa diajarkan secara langsung oleh manusia. Machine learning mempelajari teori agar komputer mampu “belajar” dari data. Machine learning melibatkan berbagai disiplin ilmu seperti statistika, ilmu komputer, matematika dan bahkan neurologi. Machine learning menggunakan teori-teori statistika untuk membangun model. The Science and engineering of making intelligent machines. (John McCarthy) . Sebuah cabang ilmu komputer yang berkaitan dengan bagaimana mensimulasikan kecerdasan pada komputer. Kemampuan mesin untuk meniru kecerdasan manusia Jadi, Inti dari machine learning adalah bagaimana membuat komputer dapat menyelesaikan berbagai persoalan dan dapat belajar sendiri seperti manusia belajar sesuatu. STATISTICS



Karl Pearson menyatakan bahwa “Statistics is the Grammar of Science”. Seringkali istilah statistika dan statistik sering disamakan, padahal mereka berbeda. Statistika merujuk kepada cabang ilmu, sedangkan statistik lebih merujuk kepada suatu data atau informasi. Itulah mengapa BPS kepanjangan-nya adalah Badan Pusat Statistik bukan Badan Pusat Statistika. Karena BPS adalah salah satu badan yang menjadi pusat data atau informasi.



Menurut Prof. Dr. Sudjana, M.A., M.Sc., statistik adalah suatu pengetahuan yang berhubungan dengan cara pengumpulan data, pengolahan penganalisisannya, dan penarikan kesimpulan berdasar kumpulan data dan penganalisa yang dilakukannya. Menurut Supranto, statistika adalah suatu cabang ilmu yang mempelajari tentang cara pengumpulan, penyajian, menganalisis data serta mengambil kesimpulan secara umum berdasarkan hasil penelitian menyeluruh yang telah dilakukan. ARTIFICIAL INTELLIGENCE



AI (Artificial Intelligence) sangat erat kaitannya dengan Machine Learning. Jika digambarkan secara diagram, wilayah kajian AI akan jauh lebih besar dibandingkan machine learning. Bisa disimpulkan bahwa machine learning adalah bagian dari AI atau machine learning merupakan implementasi atau subset dari AI. Semua hal yang berkaitan dengan machine learning praktis akan terkait juga dengan AI. Sedangkan symbolic logic, rules engines, expert systems, knowledge graphs, semuanya adalah bagian dari AI dan tidak ada sangkut pautnya sama sekali dengan machine learning. REFFERENCE 1. 2. 3. 4. 5.



Primartha, Rifkie. 2018. Belajar Machine Learning Teori dan Praktek. Informatika : Bandung. Suyanto. 2018. Machine Learning Tingkat Lanjut. Informatika : Bandung. Suyanto. 2017. Data Mining. Informatika : Bandung. J. Supranto. 1994. Statistik : Teori dan Aplikasi Jilid 1 Edisi Kelima. Erlanga : Jakarta. Sudjana. 1996. Metode Statistika, Tarsito : Bandung.



Apa Itu Data Science? Pengertian dan Manfaat November 8, 2018 bootupacademyai Data Science



Data science adalah salah satu disiplin ilmu yang secara khusus mempelajari soal data terutama data kuantitatif atau data numerik. Saat ini, ilmu yang satu ini mulai menjelma menjadi suatu profesi baru di bidang teknologi yang banyak dicari oleh berbagai jenis perusahaan. Menariknya lagi, data science atau ilmu data ini tidak memerlukan latar belakang pendidikan tertentu untuk bisa mempelajarinya.



Apa Itu Data Science? Lalu apa sebenarnya data science itu? Dan apa saja yang akan kita pelajari dalam ilmu data tersebut? Secara umum data science adalah penggalian atau bisa juga disebut mengekstrak data agar dapat difilter serta didapatkan data yang benar untuk menghasilkan produk data yang sebenar-benarnya. Banyak yang tidak mengetahui bahwa data science merupakan suatu hal yang dipekerjakan dan banyak pula perusahaan yang mencari orang dengan kemampuan ini.



data science adalah profesi baru yang menjanjikan, Yuk Kenalan dan Cari Tahu Lebih Banyak



Untuk mereka yang bekerja dalam bidang data science ini kerap disebut sebagai seorang data analyst atau data scientist. Bukan rahasia lagi jika pekerjaan di bidang data science adalah sesuatu yang masih belum banyak diketahui oleh masyarakat. Bahkan beberapa perguruan tinggi ternama pun masih belum membuka jurusan khusus untuk mencetak orang-orang hebat di bidang ini. Padahal skill di data science ini sangatlah menjanjikan.



Mengapa Data Science Menjanjikan? Menurut riset yang dilakukan oleh situs Linkedin, ilmu data atau data science adalah salah profesi paling hot yang banyak dibutuhkan oleh dunia industri akhir-akhir ini. Menariknya lagi, pekerjaan ini menjanjikan penghasilan yang cukup besar. Hal ini tentu bisa menjadi alasan untuk kita terjun ke dalam bidang yang satu ini. Selain itu, ada beberapa alasan lain yang bisa membuat kamu semakin tertarik dengan data science ini.







Dapat Dipelajari Siapa Saja



Siapa saja bisa belajar data science. Sebagai disiplin ilmu baru yang terbilang unik, data science ternyata tidak membutuhkan latar belakang pendidikan tertentu untuk mempelajarinya. Data science adalah ilmu yang bisa dipelajari seseorang dengan disiplin ilmu umum sekalipun. Namun, meskipun secara umum bisa dilakukan oleh orang dari latar belakang pendidikan apa



pun, kemampuan dasar pemrograman, matematika dan statistik akan sangat membantu dalam menjalankan data science ini.







Belum Banyak Diketahui



Untuk kamu yang ingin mendapatkan pekerjaan dengan jumlah saingan yang masih sedikit, data science adalah jawabannya. Dengan semakin majunya teknologi, kalian dengan kemampuan data science ini akan semakin bisa bernapas lega karena terdapat banyak sekali lowongan pekerjaan khusus untuk bidang ini dan saingannya pun tidak banyak karena disiplin ilmu ini masih belum diketahui banyak orang.







Kesempatan Bergabung dengan Perusahaan Besar



Hal yang paling menggiurkan dari belajar data science adalah kesempatan emas untuk bergabung dengan perusahaan-perusahaan besar dunia. Bukan rahasia lagi jika data science adalah ilmu penting bagi sebuah perusahaan terutama dalam memprediksi banyak hal di masa depan baik terkait dengan layanan atau produk mereka. Oleh karena itu, banyak perusahaan besar saat ini yang mulai menyadari hal tersebut dan mencari orang-orang dengan kemampuan data science.



Bagaimana Langkah Belajar Data Science dari Awal? Lalu, bagaimana langkah awal untuk memulai belajar data science dan menjadi seorang data analyst atau data scientist? Nyatanya, ada banyak hal yang perlu kamu pelajari hingga bisa menjadi seorang data analyst dengan penghasilan yang besar. Penasaran bagaimana cara untuk memulai memasuki dunia data science atau ilmu data ini? Langsung saja simak informasinya di bawah ini.



Ketahui Skill yang Harus Kamu Kuasai Data science adalah sebuah ilmu yang tidak berdiri sendiri. Kamu juga memerlukan beberapa ilmu atau skill lain untuk bisa bekerja dengan baik di bidang ini. Mereka dengan latar belakang pendidikan software developer juga belum tentu bisa secara otomatis menjadi seorang data scientist. Lalu, skill apa saja yang perlu kamu kuasai untuk terjun ke bidang ini?







Pemrograman



Memiliki skill pemrograman akan sangat membantu kalian dalam menjadi seorang data scientist atau data analyst. Tidak bisa dipungkiri jika data science adalah soal memasukan data-data tertentu ke komputer. Untuk memudahkan mereka dalam melakukan hal tersebu, keahlian dalam programming akan memastikan pekerjaan tersebut berakhir sempurna. Artinya, seorang data scientist setidaknya harus mengusai bahasa pemrograman seperti Python.







Statistika



Selanjutnya, pemahaman akan statistika juga merupakan suatu hal yang mendasar bagi kalian yang ingin menjadi seorang data analyst atau data scientist. Selain berguna untuk menentukan algoritma seperti apa yang akan diaplikasikan, ilmu statistika juga dibutuhkan dalam pengembangan software machine learning. Hal ini membuktikan bahwa data science adalah suatu profesi menarik yang memerlukan banyak skill sekaligus.







Komunikasi dan Visualisasi Data



Selain itu, skill komunikasi dan visualisasi data juga menjadi skill yang penting untuk kamu yang ingin terjun ke bidang ini. Terutama jika kamu masuk ke dalam sebuah perusahaan yang manajemennya data-driven. Biasanya, sebagai seorang data analyst, kamu juga diminta untuk membantu menentukan arah kebijakan. Dalam hal ini, kemampuan komunikasi dan visualisasi data menjadi penting untuk dimiliki. Temukan Tempat Belajar Data Science Terbaik Meskipun secara umum karir di bidang data science adalah karir yang bisa dirintis oleh orangorang dari berbagai disiplin ilmu, belajar ilmu data ini secara mandiri bisa jadi sangat sulit dan kemungkinan kamu untuk berhenti di tengah jalan sangatlah tinggi. Oleh karena itu, bergabung dengan akademi teknologi terbaik yang bisa menjadikanmu data analyst atau data scientist yang handal bukanlah sebuah pilihan, tetapi kewajiban. Baca Juga: Belajar Data Science Dengan Mudah BootUP Academy adalah pilihan yang tempat untuk siapa saja yang berencana mendalami data science. Data science adalah salah satu program unggulan yang ditawarkan oleh BootUP



Academy selain program lainnya seperti coding dan machine learning. Menawarkan kelas baik secara offline maupun online, akademi yang satu ini sangat cocok untuk kamu yang ingin mempelajari data science dari jarak jauh ataupun secara langsung. Yang paling menarik dari BootUP Academy ini adalah kamu akan diberikan kesempatan bekerja yang baik yang tidak akan kamu dapatkan di akademi lainnya. Seperti yang kita tahu data science adalah jalan menuju ke berbagai perusahaan besar, dan disini BootUP Academy akan membantumu menapaki karir di berbagai perusahaan mitra seperti IBM, Singtel, QuickDesk, NUS, Refash, Unframed dan sebagainya.



Kesimpulan Jadi, apakah kamu siap untuk mencari kesempatan baru yang menjanjikan dengan menjadi seorang data analyst atau data scientist? Jika kamu siap berkomitmen, jangan ragu untuk bergabung dengan BootUP Academy yang akan memberikan semua materi yang dibutuhkan untuk menjadi seorang data analyst handal. Data science adalah profesi yang menjanjikan keuntungan besar dan bergabung dengan BootUP Academy akan membantumu meraihnya!



Analitik Big Data Apa itu dan mengapa hal itu penting Analitik big data memeriksa sejumlah besar data untuk mengungkap pola tersembunyi, korelasi, dan wawasan lainnya. Dengan teknologi saat ini, dimungkinkan untuk menganalisis data Anda dan mendapatkan jawaban darinya segera – upaya yang lebih lambat dan kurang efisien menggunakan solusi bisnis intelijen yang lebih tradisional. • • • • • • • • •



Sejarah Dunia saat ini Siapa yang Menggunakannya Bagaimana Cara Kerjanya Langkah berikutnya



Sejarah dan evolusi analitik big data Konsep big data telah ada selama bertahun-tahun; sebagian besar organisasi sekarang mengerti bahwa jika mereka menangkap semua data yang mengalir ke bisnis mereka, mereka dapat menerapkan analitik dan mendapatkan nilai manfaat yang signifikan dari data tersebut. Tetapi bahkan di tahun 1950-an, beberapa dekade sebelum seseorang mengucapkan istilah "big data", bisnis menggunakan analitik dasar (pada dasarnya angka dalam spreadsheet yang dikaji secara manual) untuk mengungkap wawasan dan tren. Namun, manfaat baru yang dibawa oleh analisis big data adalah kecepatan dan efisiensi. Sementara beberapa tahun yang lalu sebuah bisnis akan mengumpulkan informasi, menjalankan analitik, dan menggali informasi yang dapat digunakan untuk keputusan di masa mendatang, kini bisnis dapat mengidentifikasi wawasan yang didapat untuk keputusan segera. Kemampuan untuk bekerja lebih cepat – dan tetap tangkas – memberi organisasi keunggulan kompetitif yang tidak mereka miliki sebelumnya.



Mengapa analitik big data demikian penting? Analitik big data membantu organisasi memanfaatkan data mereka dan menggunakannya untuk mengidentifikasi peluang baru. Analitik itu, pada gilirannya, mengarah kepada pergerakan bisnis yang lebih cerdas, operasi yang lebih efisien, laba yang lebih tinggi, dan pelanggan yang lebih bahagia. Dalam laporannya Big Data in Big Companies (Big Data dalam Perusahaan Besar), IIA Director of Research Tom Davenport mewawancarai lebih dari 50 perusahaan untuk memahami bagaimana mereka menggunakan big data. Ia menemukan bahwa perusahaan-perusahaan tersebut mendapatkan nilai dengan cara-cara berikut: 1. Pengurangan biaya. Teknologi big data seperti Hadoop dan analitik berbasis cloud membawa keuntungan biaya yang signifikan dalam hal menyimpan data dalam jumlah besar – ditambah lagi mereka dapat mengidentifikasi cara-cara yang lebih efisien dalam melakukan bisnis. 2. Pengambilan keputusan lebih cepat, lebih baik. Dengan kecepatan Hadoop dan analitik inmemory, dikombinasikan dengan kemampuan untuk menganalisis sumber data baru, perusahaan dapat menganalisis informasi dengan segera – dan mengambil keputusan berdasarkan apa yang telah mereka pelajari. 3. Produk dan layanan baru. Dengan kemampuan untuk mengukur kebutuhan dan kepuasan pelanggan melalui analitik, muncul kekuatan untuk memberikan apa yang diinginkan pelanggan. Davenport menunjukkan bahwa dengan analitik big data, lebih banyak perusahaan menciptakan produk baru untuk memenuhi kebutuhan pelanggan.



Baca dokumen resmi



Analitik big data di dunia saat ini Kebanyakan organisasi memiliki big data. Dan banyak yang memahami perlunya memanfaatkan data itu dan mengekstraksi nilai manfaat darinya. Tetapi caranya? Sumber-sumber ini mencakup pemikiran terbaru tentang persimpangan big data dan analitik. Statistik dan Pembelajaran Mesin Sesuai Ukurannya



Konsep pembelajaran mesin telah ada selama beberapa dekade dan sekarang dapat diterapkan pada data dalam jumlah besar. Baca laporan resmi Membawa kekuatan SAS® ke Hadoop



Ingin mendapatkan nilai lebih dari Hadoop? Laporan ini menyajikan portofolio solusi SAS yang membantu Anda menerapkan analitik bisnis ke Hadoop. Baca laporan resmi



Analitik big data dan layanan kesehatan



Ledakan big data sudah berada di garis horizon sehingga mengendalikan informasi kesehatan Anda menjadi lebih penting dari sebelumnya. Webinar ini menjelaskan bagaimana analitik big data berperan. Saksikan webinar Kerja keras di balik analitik



Untuk memahami peluang analitik bisnis, MIT Sloan Management Review melakukan survei tahunan keenam terhadap para eksekutif, manajer, dan profesional analitik. Baca ulasan



Siapa yang menggunakannya? Pikirkan bisnis yang bergantung pada keputusan yang cepat dan tangkas untuk tetap kompetitif, dan kemungkinan besar analitik big data terlibat dalam membuat bisnis menjadi besar. Begini cara berbagai jenis organisasi dapat menggunakan teknologi ini: Life Sciences Penelitian klinis adalah proses yang lambat dan mahal, dengan uji coba yang sering gagal karena berbagai alasan. Analisis lanjutan, kecerdasan buatan (AI) dan Internet of Medical Things (IoMT) membuka potensi untuk meningkatkan kecepatan dan efisiensi di setiap tahap penelitian klinis dengan memberikan solusi yang lebih cerdas dan otomatis. Analitik Big Data untuk Life Sciences



Perbankan Lembaga keuangan mengumpulkan dan mengakses wawasan analitik dari volume besar data yang tidak terstruktur untuk mengambil keputusan keuangan yang baik. Analitik big data memungkinkan lembaga keuangan untuk mengakses informasi yang lembaga butuhkan saat mereka membutuhkannya, dengan menghilangkan perangkat dan sistem yang tumpang tindih dan berlebihan. Analitik Big Data untuk Perbankan



Manufaktur Bagi produsen, menyelesaikan masalah bukan hal yang baru. Para produsen dengan masalahmasalah yang sulit setiap hari - mulai dari rantai pasokan yang kompleks, hingga aplikasi



bergerak, hingga kendala tenaga kerja, dan kerusakan peralatan. Itu sebabnya analitik big data sangat penting dalam industri manufaktur, karena memungkinkan organisasi yang kompetitif menemukan peluang penghematan biaya baru dan peluang pendapatan. Analitik Big Data untuk Manufaktur



Perawatan Kesehatan Big data diberikan dalam industri perawatan kesehatan. Catatan pasien, program kesehatan, informasi asuransi, dan jenis informasi lainnya mungkin sulit dikelola – tetapi penuh dengan wawasan penting begitu analitik diterapkan. Itu sebabnya teknologi analitik big data begitu penting bagi perawatan kesehatan. Dengan menganalisis sejumlah besar informasi – baik terstruktur dan tidak terstruktur – dengan cepat, penyedia layanan kesehatan dapat segera memberikan diagnosis atau pilihan perawatan yang menyelamatkan jiwa. Analitik Big Data untuk Perawatan Kesehatan



Pemerintah Instansi pemerintah tertentu menghadapi tantangan besar: mengetatkan anggaran tanpa mengurangi kualitas atau produktivitas. Hal ini terutama menyulitkan badan-badan penegak hukum, yang berjuang untuk menurunkan angka kejahatan dengan sumber daya yang relatif langka. Dan itulah sebabnya banyak lembaga menggunakan analitik big data; teknologi merampingkan operasi sambil memberikan agen pandangan yang lebih holistik dari kegiatan kriminal. Analitik Big Data untuk Pemerintah



Retail Layanan pelanggan telah berevolusi dalam beberapa tahun terakhir, karena pembeli yang berpengalaman berharap para peritel memahami dengan tepat apa yang mereka butuhkan, ketika mereka membutuhkannya. Teknologi analitik big data membantu peritel memenuhi permintaan tersebut. Berbekal sumber daya data yang tak ada habisnya dari program loyalitas pelanggan, kebiasaan membeli dan sumber lainnya, peritel tidak hanya memiliki pemahaman mendalam tentang pelanggan mereka, mereka juga dapat memprediksi tren, merekomendasikan produk baru – dan meningkatkan profitabilitas. Analitik Big Data untuk Ritel



Pelajari Selengkapnya Tentang Industri yang Menggunakan Teknologi Ini



Tujuan utama dari strategi organisasi formal untuk data dan analitik adalah untuk meningkatkan pengambilan keputusan dengan analitik dalam berbagai bidang kegiatan. [Dan] hasil survei dan



wawancara kami menunjukkan bukti kuat bahwa strategi analitik yang sukses secara dramatis mengubah cara pengambilan keputusan dalam organisasi. Dari laporan resmi Melampaui Hype: Kerja Keras di Balik Kesuksesan Analitik



Analitik lanjutan membantu Rogers Communications menjadi lebih berorientasi pada pelanggan Rogers Communications berupaya untuk meningkatkan kepuasan pelanggan dan mempertahankan kepemimpinannya di sektor media dan telekomunikasi Kanada. Pelajari bagaimana analitik canggih membantu Rogers Communication mengurangi separuh keluhan pelanggan dengan memberikan pelanggan layanan yang tepat pada waktu yang tepat. Dapatkan kisah selengkapnya



Cara kerjanya dan teknologi utama Tidak ada satu teknologi tunggal yang mencakup analitik big data. Tentu saja, ada analitik canggih yang dapat diterapkan pada big data, tetapi pada kenyataannya beberapa jenis teknologi bekerja bersama untuk membantu Anda mendapatkan nilai maksimal dari informasi Anda. Berikut adalah para pemain terbesar: Pembelajaran Mesin. Pembelajaran mesin, subset khusus AI yang melatih mesin cara belajar, memungkinkan untuk secara cepat dan otomatis menghasilkan model yang dapat menganalisis data yang lebih besar dan lebih kompleks, serta memberikan hasil yang lebih cepat, lebih akurat – bahkan dalam skala yang sangat besar. Dan dengan membangun model yang tepat, organisasi memiliki peluang yang lebih baik untuk mengidentifikasi peluang yang menguntungkan – atau menghindari risiko yang tidak diketahui. Manajemen data. Data harus berkualitas tinggi dan diatur dengan baik sebelum dapat dianalisis dengan andal. Dengan data yang terus-menerus mengalir masuk dan keluar dari suatu organisasi, penting untuk menetapkan proses berulang guna membangun dan mempertahankan standar kualitas data. Setelah data dapat diandalkan, organisasi harus membuat program manajemen data master yang membuat seluruh perusahaan pada halaman yang sama. Penambangan data. Teknologi penambangan data membantu Anda memeriksa sejumlah besar data untuk menemukan pola dalam data – dan informasi ini dapat digunakan untuk analisis lebih lanjut guna membantu menjawab pertanyaan bisnis yang kompleks. Dengan perangkat lunak penambangan data, Anda dapat menyaring semua kebisingan data yang kacau dan berulangulang, menentukan apa yang relevan, menggunakan informasi itu untuk menilai kemungkinan hasil, dan kemudian mempercepat laju pengambilan keputusan berdasarkan informasi. Hadoop. Kerangka kerja perangkat lunak open source ini dapat menyimpan sejumlah besar data dan menjalankan aplikasi pada kelompok perangkat keras komoditas. Hal ini telah menjadi teknologi utama untuk melakukan bisnis karena peningkatan volume dan varietas data yang konstan, dan model komputasi terdistribusi dapat memproses big data dengan cepat. Manfaat tambahan adalah bahwa kerangka kerja open source Hadoop adalah gratis dan menggunakan perangkat keras komoditas untuk menyimpan data dalam jumlah besar. Analitik in-memory. Dengan menganalisis data dari memori sistem (bukan dari hard disk drive Anda), Anda dapat memperoleh wawasan langsung dari data Anda dan menindaklanjutinya dengan cepat. Teknologi ini dapat menghapus latensi persiapan data dan pemrosesan analitik untuk menguji skenario baru dan menciptakan model; ini bukan hanya cara mudah bagi organisasi untuk tetap gesit dan membuat keputusan bisnis yang lebih baik, tetapi juga memungkinkannya untuk menjalankan skenario analitik iteratif dan interaktif. Analitik prediktif. Teknologi analitik prediktif menggunakan data, algoritme statistik, dan teknik pembelajaran mesin untuk mengidentifikasi kemungkinan hasil di masa mendatang berdasarkan data historis. Ini semua tentang memberikan penilaian terbaik tentang apa yang akan terjadi di masa depan, sehingga organisasi dapat merasa lebih percaya diri bahwa mereka



mengambil keputusan bisnis sebaik mungkin. Beberapa aplikasi analitik prediktif yang paling umum termasuk deteksi penipuan, risiko, operasi, dan pemasaran. Penambangan teks. Dengan teknologi penambangan teks, Anda dapat menganalisis data teks dari web, bidang komentar, buku, dan sumber berbasis teks lainnya untuk mengungkap wawasan yang belum Anda perhatikan sebelumnya. Penambangan teks menggunakan pembelajaran mesin atau teknologi pemrosesan bahasa alamiah untuk mengombinasikan dokumen – email, blog, umpan Twitter, survei, kecerdasan kompetitif, dan lainnya – untuk membantu Anda menganalisis informasi dalam jumlah besar dan menemukan hubungan topik dan istilah yang baru.



Langkah berikutnya Lihat bagaimana analitik big data memainkan peran dalam manajemen data. SAS untuk Solusi Manajemen Data



SAS® Platform Dibangun dengan strategi yang menggunakan wawasan analitis untuk mendorong tindakan bisnis, SAS® Platform mendukung setiap fase siklus hidup analitik – mulai dari data, hingga penemuan, sampai penerapannya. SAS® Platform



Analitik Teks Visual Dengan SAS® Visual Text Analytics, Anda dapat mendeteksi tren yang muncul dan peluang tersembunyi, karena memungkinkan Anda untuk secara otomatis mengonversi data yang tidak terstruktur menjadi wawasan yang bermakna yang memberi asupan pembelajaran mesin dan model prediktif. Pelajari lebih lanjut tentang analitik teks visual



Memahami Dasar-dasar “Data Science” untuk Bisnis



Mengenal Data Scientist dan Perbedaannya dengan Data Analyst Ilustrasi Data Scientist. foto/istockphoto Ilustrasi Data Scientist. foto/istockphoto Oleh: Rachma Dania - 8 Mei 2020 Dibaca Normal 1 menit Apa perbedaan Data Scientist dengan Data Analyst? Berikut penjelasannya. tirto.id - Data Scientist merupakan salah satu profesi yang kini turut berkembang bersamaan dengan berkembangnya Big Data. Walaupun memiliki nama yang hampir sama dengan Data Analyst nyatanya kedua profesi ini memiliki perbedaan satu sama lain. Disebutkan pada northeastern.edu perbedaan yang mendasari keduanya terletak pada apa yang mereka lakukan pada data. Data Analyst atau Analis Data bertugas untuk menganalisa data besar untuk mengidentifikasi tren dan mengembangkannya menjadi bentuk grafis yang ditampilkan dalam



presentasi. Hal tersebut berguna untuk membantu bidang bisnis dalam membuat keputusan. Sedangkan Data Scientist atau Ilmuan Data melakuan proses analisa data menggunakan berbagai cara dan alogaritma untuk menemukan solusi dari suatu permasalahan yang rumit. Data Scientist akan merancang dan membangun proses baru untuk pemodelan dan produksi data menggunakan prototipe, algoritma, model prediksi, dan analisis khusus. Data Scientist dapat mengatur set data yang tidak terdefinisi menggunakan beberapa alat pada saat yang bersamaan dan membangun sistem dan kerangka kerja otomasi mereka sendiri. Secara singkat, Data Scientist akan menganalisis, memproses, dan memodelkan data kemudian menafsirkan hasilnya untuk membuat rencana yang dapat ditindaklanjuti bagi perusahaan dan organisasi lain. Drew Conway, pakar ilmu data dan pendiri Alluvium, membuat diagram venn yang menggambarkan Data Scientist sebagai seseorang yang memiliki pengetahuan matematika dan statistik, keterampilan peretasan, dan keahlian substantif. Sedangkan untuk Data Analysist diperlukan keahlian seperti halnya keahlian dalam matematika dan statistik. Selain itu juga perlu bagi keduanya untuk mempelajari alat yang diperlukan untuk membuat keputusan dengan angka. Dilansir dari mastersindatascience.org terdapat beberapa ketrampilan yang diperlukan untuk menjadi data scientist: Kemampuan Pemrograman Visualisasi dan pelaporan data menggunakan beberapa aplikasi Analsis resiko Analisis statistik dan Matematika Penguasaan machine learning Komunikasi yang efektif Keterampilan Rekayasa Perangkat Lunak Penelitian Penguasaan data mining, yakni proses menemukan sebuah pengetahuan yang berharga dan tersembunyi dengan menganalisis sejumlah data yang disimpan dalam gudang data. Pemahaman Platform Data Besar Penyimpanan dan struktur data Selain itu pengetahuan kalkulus dan aljabar dari lulusan matematika penting untuk mendukung pekerjaan Data Scientist. Selain itu, sarjana dari jurusan statistik pun lebih disukai karena ilmu statistika diperlukan untuk menentukan algoritma yang akan digunakan, dan mengembangkan software machine learning. Selain itu, kualitas kemampuan berpikir kritis juga diperlukan untuk menganalisa data dan memecahkan masalah. Hal itu perlu ditambah dengan kemampuan komunikasi yang baik guna menyampaikan ide kompleks kepada stakeholder yang tidak paham soal teknis. Selain itu, Anda juga akan banyak berinteraksi dengan ahli data dan juga pebisnis. Selain dari kualitas-kualitas itu juga perlu pemahaman yang kuat tentang beberapa alat yang sekiranya dapat membatu pekerjaan data scientist: Statistik dan pembelajaran mesin. Bahasa pengkodean seperti SAS, R atau Python. Database seperti MySQL dan Postgres. Visualisasi data dan teknologi pelaporan. Aplikasi Hadoop dan MapReducE Dilansir dari prakerja.go.id, Data Scientist merupakan profesi yang saat ini cukup diminati di Indonesia berkaitan dengan big data yang makin berkembang. Keahlian Data Scientist dibutuhkan di startup hingga perusahaan besar, gaji Data Scientist dimulai dari kisaran Rp4 juta sampai Rp8 juta. Namun, ada pula perusahaan yang menjanjikan gaji Data Scientist hingga Rp28 juta. Untuk berkarier menjadi Data Scientist di Indonesia maka bisa lebih dahulu menjadi Data Analyst. Setelahnya diperlukan pelatihan tambahan untuk memahami machine learning dan deep learning. Dengan skill set yang lengkap, maka bukan tidak mungkin menjadi Data Scientist di masa mendatang.



Data is a new currency. Kalimat tersebut akhir-akhir ini santer diperbincangkan dikaitkan dengan gerakan transformasi digital, mengisyaratkan betapa bernilainya data bagi sebuah langkah strategis bisnis. Namun jika dirunut, urgensi pemanfaatan data sebenarnya tak lain muncul dari komoditas data itu sendiri sebagai objek digital. Saat ini data bisa diperoleh dari



mana saja, dari perangkat komputasi yang sehari-hari digunakan, dari penggunaan komputer, ponsel, kamera, hingga perangkat berbasis sensor yang terpasang di dinding. Tren tersebut menghadirkan dua jabatan baru dalam lini teknologi, yakni Data Engineer dan Data Scientist. Data Engineer memiliki tugas utama untuk menemukan cara dalam menangkap, mengumpulkan dan memadatkan sebuah data dari sumbernya. Domain pekerjaannya termasuk membangun dan mengelola sebuah sistem yang menjadi produsen data, hingga data-data tersebut berada di dalam sebuah tempat untuk dikelola lebih lanjut. Sedangkan Data Scientist memiliki misi mengolah data tersebut menghasilkan pengetahuan yang bernilai dan dapat diaplikasikan. Sehingga dapat disimpulkan, bahwa Data Science merupakan sebuah proses memproduksi pengetahuan data (data insight). Adapun karakteristik dari pengetahuan data tersebut ialah sebuah simpulan yang dapat dilaksanakan (actionable), memberikan simpulan atau prediksi yang dapat dimengerti untuk beragam kebutuhan spesifik.



Dasar ilmu Data Science Untuk menjadi seorang Data Scientist diperlukan pemahaman tentang beberapa hal, yakni kemampuan analisis menggunakan konsep matematika dan statistik, kemampuan pemrograman untuk pengolahan data, dan pemahaman pada subjek spesifik pada bidang bisnis yang digeluti. Karena menangani kebutuhan di bidang tertentu, Data Scientist sering direpresentasikan pada sebuah istilah yang lebih rinci, misalnya ad-tech data scientist, political analyst, head of banking digital analyst dan sebagainya. Terkait dengan dasar ilmu, matematika menjadi penting sebagai landasan metode deterministik untuk operasi perhitungan kuantitatif (numerik). Aplikasinya dalam Data Science untuk membangun model keputusan, menyusun prakiraan hingga memperhitungkan sebuah prediksi. Memahami dasar kalkulus dan aljabar linier menjadi porsi wajib saat seseorang ingin memulai terjun ke dalam analisis data. Karena keduanya teori paling fundamental yang akan banyak digunakan. Pemahaman tentang metode statistik digunakan sebagian besar untuk memahami tentang makna data, termasuk untuk melakukan validasi hipotesis dari pengetahuan yang dihasilkan data, menyimulasikan skenario, hingga membantu penyusunan sebuah prakiraan. Wajib hukumnya untuk memahami ilmu statistik dasar. Dalam penerapannya, konsep matematika dan statistika berjalan beriringan, mengharuskan pengelolanya jeli menyisipkan formula sesuai dengan pemrosesan data yang dibutuhkan. Kemampuan pemrograman atau coding–setidaknya tingkat dasar—juga harus dimiliki. Kode yang dituliskan nantinya akan digunakan untuk menginstruksikan komputer dalam memanipulasi, menganalisis dan memvisualisasikan data yang telah dirapikan.



Kegiatan mengelola data Sumber data sangat beragam, implikasinya data yang dihimpun juga bervariasi. Dalam standar data digital, setidaknya tipikal data tersebut terbagi ke dalam tiga jenis:



1. Data terstruktur (structured data); yakni data yang sudah dikelola, diproses dan dimanipulasi dalam RDBMS (Relational Database Management System). Misalnya data tabel hasil masukan formulir pendaftaran di sebuah layanan web. 2. Data tidak terstruktur (unscructured data); yakni berupa data mentah yang baru didapat dari beragam jenis aktivitas dan belum disesuaikan ke dalam format basis data. Misalnya berkas video yang didapat dari kamera. 3. Data semi terstruktur (semistructured data); yakni berupa data yang memiliki struktur, misalnya berupa tag, akan tetapi belum sepenuhnya terstruktur dalam sistem basis data. Misalnya data yang memiliki keseragaman tag, namun memiliki isian yang berbeda didasarkan pada karakteristik pengisi.



Data Engineer bertugas untuk menyelaraskan ketiga tipe data tersebut, termasuk di dalamnya mengatur skema data. Mengapa merapikan data tersebut menjadi tugas penting? Ketika berbicara data dengan ukuran yang sangat besar, efisiensi perlu dilakukan dalam arsitektur data, tujuannya untuk memberikan kemudahan sekaligus kecepatan dalam pengelolaan serta akses data. Bagi Data Scientist, salah satu validitas data juga ditentukan dari seberapa relevan sumber data yang dimiliki, baik sebagai pelengkap ataupun pembanding. Sementara itu, kegiatan analisis data dilakukan dengan bahasa Python atau R untuk memanipulasi data dan menggunakan SQL untuk melakukan query (termasuk membuat relasi) pada sumber data. Coding dilakukan kala sumber data telah menjadi ekstensi berkas yang siap diolah. Secara universal terdapat empat format umum yang dapat diterima hampir semua sistem analisis data, yaitu Comma-separated Values (CSV), Scripts (*.py, *.ipynb, *.r dll), berkas aplikasi tabel (*.xlsx, *.qgs dll), dan berkas pemrograman web (*.html, *.svg dll).



Keluaran Data Science untuk siapa saja Salah satu keterampilan yang wajib dimiliki seorang Data Scientist adalah komunikasi, baik secara lisan atau tertulis. Seluruh pengetahuan dari data harus disampaikan dengan baik, tanpa kemampuan komunikasi yang benar, maka kebutuhan tersebut tidak akan tersalurkan. Kemampuan komunikasi termasuk di dalamnya menjelaskan berbagai unsur yang kompleks sehingga mudah untuk dipahami oleh pengguna data, termasuk ketika membuat visualisasi grafik dan narasi. Perkembangan operasi bisnis digital yang sangat masif saat ini pada akhirnya membuat Data Science tidak hanya dilaksanakan oleh perusahaan besar saja, akan tetapi startup digital pun memandangnya sebagai sebuah bagian penting untuk mendampingi keputusan strategi bisnis. Sebagai ilustrasi, beberapa contoh penerapan Data Science dalam bisnis di antaranya untuk membantu sistem bisnis secara keseluruhan, tujuannya untuk meningkatkan ROI (Return of Investment) dengan memberikan gambaran tentang aktivitas terukur.



8 Skill Utama Syarat Menjadi Seorang Data Scientist Penulis Advernesia 0



Skill Utama Syarat Menjadi Seorang Data Scientist



Dilansir dari tulisan Bernard Marr di majalah Forbes bahwa jumlah praktisi yang mempunyai skill untuk melakukan analisis dan melakukan interpretasi data dalam jumlah besar (Big Data) tidak mencukupi untuk permintaan industri sekarang ini (edisi 6 Juli 2015). Kemudian menurut Udacity, berdasarkan kebutuhan industri dalam studi kasusnya (Google, amazon, dan IBM) terdapat 8 skill utama untuk menjadi seorang data scientist adalah sebagai berikut, Baca juga: Apa itu Data Science dan Data Scientist Menurut Para Ahli? 1. Penggunaan Software/Pemrograman Dasar



Untuk melakukan analisis data diperlukan minimal kemampuan penggunaan software (tools) seperti SPSS, Microsoft Excel dan SAS. Kemampuan penggunaan bahasa pemrograman untuk membantu melakukan analisis data seperti MATLAB dan R



tentunya menjadi nilai tambah yang menjadi pertimbangan industri memilih kandidat data scientist. Berlanjut terhadap kemampuan penggunaan SQL (Structured Query Language), erat kaitannya dengan data dalam jumlah besar.



2. Pengetahuan Statistika Dasar



Pengetahuan statistika dasar merupakan kemampuan vital seorang data scientist yaitu statistika deskriptif, maksimum likelihood, statistika matematika, dan lain-lain. Sebagaimana ilmu statistika diperlukan oleh semua industri maupun instansi untuk melakukan analisis data. Tentunya hal ini menjadi syarat utama untuk pemilihan kandidat data scientist.



3. Machine Learning



Machine learning merupakan kemampuan yang berkaitan dengan teknik mengajarkan komputer berfikir seperti manusia atau binatang. Machine learning digunakan dalam berbagai bidang misalnya computational finance, image processing, computer vision, computational biology, energy production, automotive, aerospace, manufacturing dan natural language processing.



4. Kalkulus dan Aljabar Linear



Kalkulus dan aljabar linear merupakan cabang pertama dari ilmu matematika. Kalkulus merupakan ilmu tentang limit. Pemahaman mengenai fungsi, integral, turunan, trigonometri dalam ilmu kalkulus adalah skill dasar seorang data scientist. Begitu pula pemahaman mengenai aljabar linear, mempunyai andil yang besar untuk melakukan perhitungan komputasi menggunakan algoritma tertentu terhadap data.



5. Data Munging



Data munging adalah kemampuan untuk merapikan data baik berdasarkan struktur, tipe data dan lain-lain. Seringkali data yang dianalisis tidak teratur atau bahkan menjadi lebih berantakan, oleh karenanya diperlukan kemampuan untuk menangani ketidaksempurnaan data. Misalnya mencakup format tanggal yang tidak sesuai, string yang tidak lengkap, dan nilai yang hilang.



6. Visualisasi dan Mengkomunikasikan Data



Kemampuan untuk melakukan visualisasi data berkaitan dengan membentuk plot dari data baik dalam bentuk 2D maupun 3D serta penjelasan lain yang perlu ditambahkan. Kemudian kemampuan mengkomunikasikan data menjadi hal yang luar biasa penting untuk perusahaan yang pertama kali menggunakan data scientist sebagai tenaga ahli yang membantu pengambilan keputusan. Dalam kondisi seperti ini data scientist dituntut untuk bisa menjelaskan data dan visualisasinya dengan baik di depan umum, baik secara teknis maupun non-teknis untuk mempermudah pemahaman pendengar.



7. Software Engineering



Kemampuan software engineering diperlukan untuk membangun suatu sistem yang dapat mempermudah pekerjaan suatu perusahaan. Tentunya dengan memiliki kemampuan software engineering akan menjadi nilai tambah untuk diterima sebagai data scientist suatu perusahaan. Misalnya kemampuan membuat software desktop, website maupun mobile apps. Dengan memiliki kemampuan software engineering, data scientist diharapkan mampu membuat sistem yang mempermudah pengelolaan data suatu perusahaan, terutama untuk perusahaan yang pertama menggunakan tenaga data scientist.



8. Berfikir Seperti Seorang Data Scientist



Untuk menjadi seorang data scientist, kandidat yang dipilih suatu perusahaan adalah kandidat yang berfikir sebagai data scientist. Berfikir seperti data scientist berarti kandidat yang dipilih merupakan pemecah masalah atau problem solver yang menggunakan metode-metode serta alasannya untuk memecahkan permasalahan perusahaan. Selain itu data scientist harus mampu berkomunikasi dengan profesi lainnya seperti software engineer dan manager perusahaan.



Baca juga tutorial lainnya: Daftar Isi Data Science



Itulah 8 skill utama untuk menjadi seorang data scientist menurut Udacity. Tentunya kemampuan terkait terhadap suatu perusahaan tertentu di luar 8 skill di atas, dapat menjadi nilai tambah sebagai kandidat data scientist yang terpilih.