طريقة تسوية البيانات في الاكسل
تخيل اتنين بياعين ورد عندهم حديقة ورد، وعايزين يعرفوا مين أفضل في زراعة الورود. واحد اسمه جاك بيقول: “عندي 5 فروع ورد جابوا 30 وردة السنة دي!” والتانيه ماري ردت: “انها جابت 100 وردة الشهر ده!”. بس كده، تعالي دلوقتي نتكلم بالتفصيل عن كيفية تجانس البيانات من خلال المثال ده!
لو بس قارنا بين 30 وردة جاك و 100 وردة ماري، هيبقي واضح إن ماري أفضل بايع ورد.
بس فكر كدا، لو كان لازم ماري تزرع 25 فرع ورد عشان تجيب الحصاد ده، يبقى ده يعتبر إنجاز أفضل من جاك.
نجيب المعلومات اللي في النص ونعمل “تجانس” للبيانات، يعني نشوف الحاجات بشكل أحسن وبطريقة عادلة أكتر.
جوهر الموضوع إنهم اتنين بيزرعوا ورود وبيتنافسوا، جاك بيقول إنه زرع 5 فروع وجاب 30 وردة، وماري بترد عليه انها جابت 100 وردة الشهر اللي فات.
لكن عايزين نعرف مين أحسن، فعشان كده هنشوف إزاي كل واحد زرع ورود بالنسبة لعدد الفروع اللي عنده.
جاك زرع 30 وردة على 5 فروع، يعني 6 وردات لكل فرع، وماري جابت 100 وردة على 25 فرع، يعني 4 وردات لكل فرع.
دلوقتي لما عملنا “تجانس” للبيانات، بقي واضح إن جاك هو الأحسن والأكتر مهارة في زراعة الورود!
إقرأ المزيد: ازاي تحسب الانحراف المعياري في اكسل؟
إيه هي الداتا المعيارية؟
هي الداتا اللي تم تحويلها عشان تناسب مدى معين بشكل عام. يعني لو عندنا قيمة بقيم بين “y” و “z” مثلا.
عايزين نبسط القايمة دي بتغيير نطاقها، عشان تكون بين “a” و “b” مثلا.
عشان نحسب القانون، خلينا نفرض إن القايمة بتبدأ برقم إكس.
إكس: هو أول قيمة بتظهر في القايمة
القانون اللي بنمشي بيه عشان نوّحد قيمة إكس هو:
لما نحسب القانون للقيمة الأولى إكس، بنقدر نكرر نفس القانون على كل الخلايا التانية عشان نوحد كل القيم في القايمة، وكده في النهاية، هتطلعلنا مجموعة بيانات أسهل في القراءة والفهم، وده توضيح لـ إزاي القايمة بتبقى بعد عملية التوحيد:
إيه الفرق بين الـNormalization والـStandardization؟
التسوية والمعيارة دول مصطلحات بيتلخصوا في بعض وبيبقوا ملخبطين بشكل كبير، فلو عايزين نظبط قايمة بيانات ونخليها كلها بنفس المستوى، بنعمل التسوية، بمعني اننا نجيب قيم البيانات ونطبق عليهم عمليات رياضية معينة عشان نوصلهم لنفس المستوى، بس لو عايزين نحول القيم لمستوى معين مع مراعاة الفروق بينهم، ممكن نستخدم المعيارة، في إكسل في فورمولا اسمها “Standardize” بتساعدنا نعمل المعيارة.
لما بنعمل التسوية، بنحول القيم الأصلية لمستوى محدد عشان تبقى في نفس النطاق، لكن لما بنعمل المعيارة بنحول القيم عشان نكُّون توزيع بمتوسط قيمته صفر وانحراف معياري واحد، ده اللي بيتسمى نتايج الـ”Z-scores” أو التحويل للوسط المعياري.
طريقة تسوية البيانات في إكسل؟
الحسابات اللي بتتعمل عشان المعيارة سهلة جدا، ولنفترض إن عندنا قايمة بيانات بقيم بين y و z والقايمة بتبدأ بالرقم X.
X: هو أول قيمة في القايمة
الفورمولا اللي بنستخدمها عشان نحسب المعيارة للقيمة X هي:
X_standardized = (X – mean of range) / standart deviation of the range
الفورمولا في إكسل اللي بنستخدمها عشان نحسب المعيارة هي:
STANDARDIZE (X; mean of range; standard deviation of the range)=
فطبعا عشان تكتب الفورمولا دي، لازم تعرف الفورمولا اللي بنستخدمها عشان نحسب المتوسط، وكمان الفورمولا اللي بنستخدمها لحساب الانحراف المعياري.
فورمولا حساب المتوسط:
=AVERAGE(range of values)
فورمولا حساب الانحراف المعياري:
=STDEV(range of values)
طيب، دلوقتي يلا نعرف ازاي نطبق الصيغ دي على مثال في الجدول اللي في الإكسل.
الخطوة الأولى: حساب المتوسط
أول حاجة لازم تعملها هي انك تحسب متوسط البيانات، وعشان تعمل كده، هنستخدم الفورمولا دي:
=AVERAGE(range of the values)
الخطوة التانية: حساب الانحراف المعياري
دلوقتي، هنستخدم إكسل عشان يحسب الانحراف المعياري، هتكتب قبل ما تعمل التطبيع أو التسوية للبيانات الصيغة دي:
=STDEV(range of values)
الخطوة التالتة: تسوية القيم
بما إننا عندنا كل اللي محتاجينه، فالتسوية هتبقى أمر سهل باستخدام الفورمولا دي:
=STANDARDIZE (X, mean of range, standard deviation of the range)
الطرق المستخدمة في تسوية ومعيارة البيانات
فيه طريقتين مشهورين لتسوية البيانات عشان:
- نخلي مجموعة بيانات أسهل في الفهم والتقييم.
- نقارن بين أكتر من مجموعة بيانات بمداهم المختلف.
1) عشان نخلي مجموعة بيانات معينة أسهل في الفهم والتقييم:
مثلا لو عندنا قايمة فيها درجات 10 طلاب في مادة الرياضيات، والدرجات بتتراوح بين 0 و 100، لكن عايزين نحولها عشان تكون بين 0 و 1 عشان نقدر نقيمها بشكل أسهل، لما بنعمل الحسابات اللازمة، الدرجات بتطلع بالشكل ده:
هتقدر تستنتج إن أكتر ولاد ناجحين هم جيسون ومايك بفضل التسوية، وعشان نتأكد من حساباتنا، نقدر نعمل رسوم بيانية ونشوف إن الرسم الخاص بكل عمود فيهم نفس الاتجاه (بس بمدى مختلف).
2) عشان نقارن بين أكتر من مجموعة بيانات بمداهم المختلف:
مثلا عندنا قايمة بنتايج امتحان الرياضيات ونتايج امتحان الفيزياء وعايزين نقارن ونعرف من هو أكتر واحد ناجح في كل مادة، لكن امتحان الرياضيات كان نظام الدرجات من 100 وامتحان الفيزياء نظام الدرجات من 50، عشان النتايج تكون منطقية ومقارنة أرقام موحدة، لازم نوحد الدرجات، فهتبقي كده:
دلوقتي، هنشوف كل الدرجات وكأن الامتحانات كانت من ١، فلما نعمل رسومات بيانية من الدرجات الأصلية والموحدة، هنلاحظ إن البيانات الأصلية مش مظبوطة أو مُضللة، مثلا واضح ان جيسون أفضل في الرياضيات، لكن في الحقيقة هو أفضل في الفيزياء، وحاجات تانية ممكن تستنتجها بشكل مظبوط.
الـStandardization بنستخدمه بطرق مختلفة:
- عشان نبسط المتغيرات بمتوسط 0 وانحراف معياري 1.
- نقدر نقارن بين تغيرات مجموعات بيانات عندها متوسطات و/أو انحرافات معيارية مختلفة، بنستخدم لمعيارة.
1) لتبسيط المتغيرات المختلفة بمتوسط 0 والانحراف المعياري 1:
بنستخدمه عشان نبسط متغيرات مختلفة بطريقة معينة، يعني بنجيب المتوسط العام والانحراف المعياري ونعملهم ٠ و ١ على التوالي، علشان نقدر نقّيم المتغيرات بشكل سهل ونفهمها، زي مثال محفظة الاسهم اللي عندنا فيها ٨ حسابات ومتوسطها ٢٣.٥ وانحرافها المعياري ٢٢.١، لما نستخدم الـStandardization هنقدر نفهمها ونقيمها بسهولة.
المعيارة بتقولنا على الفرق بين قيمة حاجة معينة والمتوسط، لو القيمة بتاعتها تحت المتوسط بيبان ده برقم سالب، ولو فوق المتوسط بيبان برقم موج، زي مثلا لما نقول ولمارت عندها -0.610 انحراف معياري تحت المتوسط (لأنه رقم سالب) وعند آبل 1.513 انحراف معياري فوق المتوسط (لأنه رقم موجب).
2) عشان نقدر نقارن بين تغيرات مجموعات بيانات مختلفة اللي عندها متوسطات و/أو انحرافات معيارية مختلفة:
مثلا لو عندنا قيم شهرية لحسابين مختلفين في البورصة، ولما عملنا معيارة للبيانات، هتطلعنا البيانات بالشكل ده:
ليه لازم نعمل تسوية للمتغيرات؟
تقنيات التسوية والمعيارة من الأدوات الممتازة، خصوصًا لو كان عندنا بيانات كبيرة أو بيانات بمقاييس مختلفة، عشان التقنيات دي بتساعد في تقليل حجم البيانات الكبيرة، وكمان بتسّهل علينا استخدامها بشكل مظبوط ونقدر نعمل تحليلات من خلالها، فلو كان التحليل الإحصائي والنمذجة الإحصائية وتحليل العناقيد من الحاجات اللي بتخص شغلك، فتقنيات التسوية والمعيارة دي هتساعدك في بناء نماذج تنبؤية واكتشاف العلاقات والارتباطات بين مجموعات البيانات لو كانت موجودة.
مهم: إزاي نحسب الـ Z Score في اكسل؟
في الاخر أحب أقولك بشكل عام، لو عايز تعمل عرض تقديمي لشركتك عن موضوع معين، أو لو عايز تقلل حجم البيانات اللي بتتعامل معاها علشان تقدر تستخرج نتايج دقيقة، ففكر إنك تستخدم وظايف التسوية أو المعيارة في إكسل.