ما هو علم البيانات؟
الوقت المقدّر للقراءة: 2 دقيقة و 38 ثانية
البيانات هي “نفط القرن الواحد والعشرين”، هذا هو المصطلح الذي تم استخدامه للدلالة على أهمية البيانات في العصر الحالي. ولقد استطاع الإنسان أن يولد أكثر من 90% من البيانات والنتاج الفكري على وجه الأرض وعلى مر التاريخ في السنتين الماضيتين فقط! ومن المتوقع أن تزداد هذه النسبة عدة أضعاف في سنة 2020.
وكما في حالة النفط الخام، لا يمكننا استعماله و الاستفادة منه إلا في حال تكريره. كذلك هي البيانات، لا يمكننا الاستفادة منها إلا في حال تنقيبها وتحليلها واستخراج ما ينفع منها ويفيد.
ومن هنا برزت أهمية “علم البيانات”، الذي سوف نقوم بالتعريف عنه في هذه المقالة، وعن المهارات والمجالات التي يجب أن يتقنها الشخص حتى يضع خطواته الأولى في هذا المجال.
في البداية أود أن نقوم بفصل مصطلح “علم البيانات” إلى كلمتين منفصلتين والتعرف على كل واحدة منهم على حدى.
ماذا نعني بكلمة “علم” وما هي المنهجية العلمية؟
“العلم هو المعرفة التي يتم التوصل لها من خلال الدراسة والممارسة والملاحظة المنظمة للأحداث والظروف الطبيعية، من أجل اكتشاف حقائق عنها ومن أجل صياغة القوانين والمبادئ التي تعتمد على هذه الحقائق”
ويقوم العلماء باتباع المنهج العلمي الذي يعرف ب “الأسلوب المتبع في التفكير للتوصل إلى نتائج يمكن تعميمها وهي نتائج المعرفة العلمية”. وتتمثل خطوات المنهج العلمي:
1- السؤال/المشكلة (Question/Problem)
2- الملاحظة/البحث (Observation/Research)
3- وضع الفرضية (Hypothesis)
4- التجربة (اختبار صحة الفرضية) Experimentation
6- التوصل إلى نتائج المعرفة العلمية (Conclusion)
ما هو مفهوم البيانات والمعلومات؟
البيانات:
هي مجموعة من الحروف أو الكلمات أو الأرقام أو الرموز أو الصور (الخام) المتعلقة بموضوع معين. ينتج عن تحليل البيانات، المعلومات.
المعلومات:
هي البيانات التي تمت معالجتها بحيث أصبحت تحمل معنى ومرتبطة بسياق معين.
إذا ما هو علم البيانات؟
إن علم البيانات هو مجال واسع وخليط من عدة مجالات مرتبطة مع بعضها، يركز بشكل أساسي على معرفة وفهم البيانات التي تمتلكها شركة أو مؤسسة معينة واستخادمها لحل مشكلة أو الإجابة عن أسئلة معينة أو تقديم توصيات ونصائح للإدارة لتحسين العمل، وكل ذلك باتباع المنهجية العلمية التي تحدثنا عنها سابقاً.
اكتشاف وفهم البيانات
يهتم هذا القسم في اكتشاف المعرفة المخبئة داخل البيانات. لتميكن الأعمال من اتخاذ قرارات ذكية تحقق لهم فائدة أكبر!
حيث يعتمد بشكل كبير على علم الاحصاء والرياضيات.
لنتخيل أنه لدينا تطبيق موبايل لبيع الملابس يعمل على أجهزة الأيفون والاندرويد.
البيانات (Data): أطهرت لدينا انه خلال الشهر الماضي تم استخدام التطبيق من قبل 5000 مستخدم.
التحليلات(Analytics): يمكن استخادم التحليلات لإيجاد عدد المستخدمين الذين استعملو التطبيق من خلال الايفون.
فهم التحليلات (Insights): من الممكن اكتشاف ان مستخدمي الايفون هم اقل احتمالاً للشراء عبر التطبيق بنسبة 40%.
الخطوة التالية تتمثل بمعرفة السبب وراء انخفاض نسبة التعاملات باستخدام اجهزة الايفون مقارنة بباقي الأجهزة.
هل يمكن أن يتعلق هذا الأمر بصعوبة وتعقيد واجهة استخدام التطبيق في الايفون؟
فإذا كان الأمر صحيحاً، فإن جعل واجهة الاستخدام بسيطة أكثر، سوف يرفع من احتمال عملية شراء المنتجات عبر المستخدمين الذين يملكون أيفون.
تطوير منتجات مرتبطة بالبيانات
يستخدم هذا القسم البيانات الموجودة لدى الشركة، كمدخلات إلى الخوارزميات والنماذج التي يقوم ببنائها “عالم البيانات”.يعتمد هذا القسم بشكل كبير على معرفة الشخص بعلم الحاسوب وخوارزميات تعلم الألة والذكاء الصنعي.
هنالك العديد من المواقع التي نستعملها كل يوم والتي تعتمد على هذا المفهوم بشكل أساسي:
• Google Search عندما تقوم بالبحث عن شيء معين، فإن محرك البحث غوغل لايقوم بعرض النتائج المتعلقة بهذه الكلمة فقط، بل يستخدم جميع البيانات التي يمكن الحصول عليها من المستخدم لعرض أفضل نتيجة ممكنة. فالنتائج سوف تتعلق بالأمور التي قمت بالبحث عنها سابقاً، بمكانك الجغرافي ( في أي بلد أنت )، بتحليل الأمور التي تحبها. بعمرك وجنسك، والعديد من الأمور الأخرى.
• Spell Checking حيث يقوم غوغل بمراقبة الكلمات التي يقوم المستخدم بالضغط عليها حتى يقوم بتحسين الخوارزمية الخاصة بتصحيح الأخطاء الأملائية.
• Gmail يقوم باستخدام خوارزمية معينة بتصنيف رسائل البريد الإلكتروني بين رسائل مهمة أو رسائل مزعجة.
• Netflix يعد استخدام نظم التوصية Recommendation systems من أحد أهم الأمور الموجود في هذا المجال، حيث تقوم بالاعتماد على اهتمامات المستخدم ونمط الأفلام التي يشاهدها، والأفلام الأخيرة التي شاهدها وجنسه وعمره، والتقييمات التي وضعها على الأفلام بتوصية أفلام جديدة من الممكن أن تعجب المستخدم.
هذا المقال من إعداد مدونة عربي Data Science (مدونة عربية تهتم بكل ما يتعلق بعلم البيانات، تحليل البيانات، البيانات الضخمة، الذكاء الاصطناعي, وتعلم الآلة بطريقة سهلة وواضحة)
إعداد: Eyad Al-Khayat
مهندس برمجيات، أعشق تحليل وتفسير البيانات لجعل الأعمال تتخذ قرارات أفضل. ومهتم بكل ما يتعلق بـ الذكاء الاصطناعي و تعلم الآلة.