إزاي تمنع مشاكل عدم تطابق البيانات والتناقضات في ملف إكسل؟

إزاي تمنع مشاكل عدم تطابق البيانات والتناقضات في ملف إكسل؟

البيانات الايام دي بقت أهم حاجة في حياتنا، بس طبعًا الإكسل مش غايب من الصورة، بس إزاي إزاي تمنع مشاكل عدم تطابق البيانات والتناقضات في ملف إكسل؟ الحل ببساطة إننا نستعمل أدوات التحقق والتصحيح اللي متاحة في الإكسل، ونطبق المبادئ التحليلية السليمة على البيانات بتاعتنا، وبكده هنضمن إننا نمتلك بيانات متناسقة ومتوافقة في الملف وهنقدر نعمل شغلنا بدقة وسهولة.

البيانات الجيدة تؤدي إلى قرارات جيدة.

بيل غيتس

إقرأ المزيد: ازاي استخدم إكسل كقاعدة بيانات؟

إيه هي مشكلة عدم تطابق البيانات؟

بغض النظر عن ادخال بيانات غلط في قاعدة البيانات، ممكن تكون أكتر المشاكل المزعجة والمحبطة هي عدم توافق البيانات. بيبان بالنسبة لكل الناس من بره علي أنه خطأ مبتدئ، ولكنه في الحقيقة موقف منتشر جدًا وبيتكرر كتير عشان كده لازم الخبراء والمحترفين يتعاملوا معاه.

معنى كلمة “عدم اتساق البيانات” إيه؟ وبيأثر إزاي على الشغل اليومي؟ وإزاي ممكن تمنعها قبل ما تحصل؟ وإزاي تقدر ترجع لمستوى الاتساق الأصلي للبيانات؟ لو كنت مهتم بالإجابة على الأسئلة دي، فأنت جيت المكان المناسب! خلينا ندخل في الموضوع.

الـ Data inconsistency معناها إن نفس البيانات في الداتابيز مختلفة عن بعض، يعني إن في نفس البيانات دخلت على النظام بتنسيقات مختلفة. في Excel ممكن البيانات تكون مختلفة من خلية لخلية، ممكن يكون ظاهر إن في خليتين (أو أكتر) نفس الحاجة، بس فعليًا البيانات بتكون مختلفة لما تتعامل معاهم على الكمبيوتر.

أمثلة على عدم اتساق البيانات

طيب، نجيب مثال عن فرق البيانات والمشاكل اللي بتحصل فيها بسبب تباين البيانات في العموم.

  • مثال 1: الفترات

خلينا نجرب أول مثال ونحاول نشوف الفرق بين خليتين من البيانات:

Company Inc. Annual Profit = $22,051,998

Company Inc Annual Profit = $22,051,998

قدرت تعرف الفرق بين الخليتين؟ الفرق هو وجود نقطة (.) في اسم الشركة في الخلية الأولى “Company Inc.”، أما في الخلية التانية الاسم بدون نقطة “Company Inc”. ممكن موضوع النقطة ده من وجهة نظرك يكون حاجة بسيطة، لكن بالنسبة للكمبيوتر الخليتين دول مختلفين عن بعض بسبب النقطة دي.

يعني الحكاية إن في المثال ده الشركتين في الخلايا بتاعت البيانات دول هما نفس الشركة، وإنك لو نسيت تحط نقطة في الاسم مش هيخلي فرق كبير بالنسبة ليك. بس البرنامج اللي انت بتستخدمه، زي برنامج Excel، مش هيعتبرهم “تطابقات تامة”.

وده بيأثر عليك بشكل كبير، عشان لو عندك بيانات كتير وبتستخدم ميزات البحث في البرنامج، التطابقات التامة دي بتوفرلك وقت وجهد كبير. ونسيان نقطة صغيرة في الاسم هيخلي البيانات عندك متعارضة وده بيأثر على وقتك وسير عملك.

مثال 2: الفراغات

الفراغات الزيادة غير الضرورية في الخلايا من أعداء وظيفة المطابقة الدقيقة. دول بيتبعوا نوع من عدم اتساق البيانات اللي ممكن تبقى مش متوضحة على العين المجردة. يعني بالنسبالك ممكن تشوف الخلية وتفترض إنها زي اللي جنبها، لإن الفراغات دي بتختفي في الخلفية البيضا. عشان نوضح مثال عن عدم تطابق البيانات، هنستخدم الجملة دي ونحط علامات اقتباس حوالين النص في الخليتين:

“شركة”

“شركة “

زي ما قولنا فوق، من غير العلامات دي، الفرق بين الخليتين هيكون صعب جدًا تحديده، والسبب في دا وجود فراغ واحد بين الكلمتين في الخلية التانية، وده بيعمل مشكلة في عملية المطابقة الدقيقة. البيانات دي تبان إنها شبه بعض، لكن في الحقيقة هي مختلفة، والبرنامج بيقدر يحس بالفرق ده.

مثال 3: الحروف الكبيرة

المثال ده عن الحروف الكبيرة والصغيرة، الفرق بينهم سهل جدًا، بس برضو مش لازم يعني إن الكمبيوتر هيعاملهم كلهم نفس الحاجة. خلينا نشوف المثال ده:

Company Inc.

Company INC.

الفرق واضح إن في الخلية التانية حروف كبيرة، بس البرنامج ممكن يكون بيعاملهم بشكل مختلف. في حالة المطابقة الدقيقة للبيانات ممكن تتأكد من إعدادات البحث الخاصة بحروف الحجم الكبير والصغير، وتحديد الخيارات المفضلة بالنسبالك.

المطابقات: دقيقة، قريبة، وضبابية

ممكن تكون مفاجأة ليك إن الحواسيب والأجهزة الرقمية في أغلب الاحيان بتكون كويسة جدًا في معرفة المطابقات الدقيقة للبيانات المدخلة، بس مش بيكونوا زي الإنسان في معرفة المطابقات القريبة. خلينا كده نتعرف سوا علي التعريفات المختلفة للانواع المختلفة من المطابقات.

  • المطابقة الدقيقة

دي بتبقى لما بيكون عندنا اتنين من مدخلات بيانات متشابهين تمامًا، يعني بالظبط نفس الحرف أو الرقم. لو كنا بنتعامل مع حروف، لازم كل حرف يكون متشابه تمامًا، حتى لو كان في فراغات بينهم. ولو كنا بنتعامل مع أرقام، لازم كل واحدة منهم تكون بنفس الترتيب والتنسيق الصح. ولو كنا بنستخدم الأرقام العشرية، لازم نتأكد من العلامات الصحيحة للترقيم.

من الاخر كده، المطابقة الدقيقة بتكون لما نلاقي مدخلات بيانات متشابهة تمامًا بالحرف أو الرقم.

الفروقات في علامات الترقيم لفصل الأرقام العشرية

اللغة الإنجليزية بتستخدم النقطة (.) عشان تفصل بين الأرقام اللي بعد الفاصلة وبين الآلاف، يعني لو أنت ساكن في بريطانيا أو الولايات المتحدة الأمريكية، هتستخدم النقطة (.). ومعظم دول آسيا اللي بتتكلم بالإنجليزي بيفضلوا يستخدموا النقطة (.) كمان في فصل الأرقام اللي بعد الفاصلة والآلاف. بس في دول تانية بيستخدموا علامات تانية غير النقطة (.).

الدول الأوروبية وجزء كبير من إفريقيا ومعظم دول أمريكا الجنوبية بيستخدموا الفاصلة (,) بدل النقطة (.) عشان يفصلوا بين الأرقام اللي بعد الفاصلة والآلاف. فلو عايز تحافظ على تسجيل بياناتك متسق في الجداول والملفات بشكل عام، لازم تحدد تفضيلاتك وتختار إما النقطة أو الفاصلة وتستخدمها في كل مكان بنفس الطريقة.

تخيل إنك شركة جديدة بتتأسس في الولايات المتحدة وبتقدم قاعدة بياناتك لشركة من إندونيسيا اللي عايزة تستثمر في شركتك. لإنك من الولايات المتحدة، هتستخدم النقط في فصل الأرقام اللي بعد الفاصلة والآلاف. بس في اللغة الإندونيسية، بيستخدموا الفاصلة عشان يفصلوا بين الأرقام اللي بعد الفاصلة والآلاف. لو غيّرت النقط لفواصل، هتساعد الشركة الإندونيسية إنها تحس بالراحة والتوافق أكتر مع البيانات اللي بتعرضها عليهم.

  • المطابقة القريبة

العقل البشري والعيون أدوات مذهلة في البحث عن الأنماط، الإنسان بيقدر يبحث عن الشبهات، يلاقيها، ويستمر فيها لو عايز. وهتتوقع إن الكومبيوترات والأجهزة الرقمية هتقدر تعمل نفس الحاجة دي بشكل أفضل من الإنسان. هتفكر إن الكومبيوترات بتعمل المعالجة بشكل مثالي وبيقدروا يلاقوا الشبهات بين المجموعات المختلفة من البيانات بسهولة… في الحقيقة ده غلط!

الكمبيوترات والأجهزة الرقمية مش بتعمل المطابقة القريبة كويس زي الإنسان، ويمكن يبقى في اختلافات صغيرة بين مدخلات البيانات المختلفة. وفي المشاكل دي، المطابقة القريبة بتحاول تلاقي مدخلات البيانات المتشابهة للدرجة اللي ممكن تكون غير مطابقة تمامًا. بصراحة، الناس أحسن من الكمبيوترات في اكتشاف الأنماط المتشابهة والمطابقة القريبة. والسبب إن الناس بتتعامل بطريقة مختلفة عن الكمبيوترات، وبتستخدم العين والمخ بدل من النظام الثنائي اللي بيستخدمه الكمبيوتر. فبالتالي الناس بتقدر تلاقي الشبهيات والاختلافات بشكل أسهل من الكمبيوتر.

ده ممكن يتحسب علي إنه من الفوائد، بس في نفس الوقت، الحقيقة إن ده من العيوب. وده ببساطة عشان احنا عايشين في عصر رقمي، والحاجات بتكون كلها بتتعامل بشكل إلكتروني، فالكمبيوترات مش بتقدر تعمل المطابقة القريبة بنفس الدقة اللي بنقدر نعملها احنا كبشر. المطابقة القريبة بتشير للبيانات اللي ممكن تكون قريبة جدًا من بعض، وممكن تبقى متشابهة بنسبة 50% إلى 99%. بس لازم تكون عارف دايمًا إن المطابقة القريبة مش هي المطابقة المئوية. المطابقة المئوية بتعتبر المطابقة الدقيقة المية في المية، واللي بتمثل المطابقة الكاملة.

  • المطابقة الضبابية

الفرق بين المطابقة المشوشة والمطابقة القريبة، إن المطابقة المشوشة بتأخد في الاعتبار سياق البيانات. مثلًا، لو كنت بتدخل بيانات لإدارة البيع بتاعتك وعايز تدور على مطابقات فيها، فكلمة مثلا زي (أو بيانات رقمية) تدور عليها في مجموعة بيانات إدارة البيع، ممكن تجيبلك مطابقة مشوشة لإن السياق متشابه. بس لو كنت بتدور على بيانات مرتبطة بإدارة البيع في مجموعات بيانات أقسام مختلفة أو كتب إلكترونية مختلفة، هتجيبلك مطابقات قريبة. لإن السياق هنا هيبقى ضايع.

نسبة التشابه للمطابقة المشوشة أو الضبابية بتبقى زي اللي في المطابقة القريبة. بتتراوح بين 50 و 99 في المية. بس في بعض البرامج والتطبيقات اللي بيستخدموها للبحث عن “مطابقات”، بتقدر تعدل النسبة. مثلاً، تقدر تقول “عايز أشوف المطابقات في نسبة 25% كمان”. عشان تعمل كده، لازم تدور على إعدادات المطابقات وتخفض نسبة التشابه لو عايز تشوف تشابهات أكتر وأوسع.

عيوب عدم تناسق البيانات

إزاي تمنع مشاكل عدم تطابق البيانات والتناقضات في ملف إكسل؟
عيوب عدم تناسق البيانات

دلوقتي بقي لو فهمت المشكلة اللي بتحصل لما البيانات مبتبقاش متطابقة، هتبقى عايز تعرف إيه هو الأثر اللي بيحصل بسبب ده. الفصل ده هنركز فيه خصوصًا على العيوب والأضرار اللي بتحصل بسبب عدم اتساق البيانات، وهنشوف إزاي بتأثر على وقتك، وعلى جداول البيانات وقواعد البيانات اللي بتتعامل بيها.

اللخبطة في الملخصات

واحد من أهم الأدوات والوظايف اللي بيقدمها برنامج إكسل والقوالب اللي بيستخدمها هي قدرته على عمل تقارير. التقارير دي بتوفرلك ملخصات وتفاصيل بشكل تلقائي. وبتيجي بسهولة لإنها بتعمل التقارير دي بناءًا على الاحتياجات اللي انت عايزها في ثواني معدودة. ولو مكنش عندك التقارير دي، كنت هتتعامل وتكافح مع التحليلات والملخصات دي بطريقة يدوية، وكنت هتضيع وقتك الغالي على الملخصات اليدوية دي، بس متقلقش، لإن إكسل بيقدم ليك دواله للتحليل والملخصات بشكل آلي.

بس هل بتقدم ليك تقارير دقيقة؟ الإجابة بتعتمد عليك! الدقة في التلخيصات بتعتمد على البيانات اللي بتدخلها في قاعدة البيانات. فلو هنستخدم نفس المثال اللي في الفصل الأول. أنت دخلت بس خليتين بيانات:

Company Inc Weekly Loss

Company Inc. Weekly Loss

أنت عايز تعرف عدد استخدامات اسم “Company Inc.” بالظبط، فبتبدأ تبحث عن “Company Inc.” باستخدام الدوال والصيغ المختلفة اللي في إكسل. وانت متأكد إنه في حالتين استخدام لكلمة “Company Inc.” عشان انت شايف الخليتين اللي فيها المعلومات. لكن برنامج الإكسل بيقولك إنك عندك حالة واحدة بس من “Company Inc.” في جدول البيانات.

لو نسيت تحط نقطة في الخلية الأولى بيكلفك دقة النتايج اللي بتجيبها بعد التلخيص. بس دي مشكلة ممكن تتحل بسهولة، صح؟ بس لو فرضنا إن عندك آلاف الصفوف والأعمدة من الخلايا مليانة بكميات كبيرة من البيانات اللي فيها حروف وكلمات وجمل، وفرضنا إن عندك آلاف أسماء شركات وأقسام مختلفة، هتقدر تحل المشكلة دي بسهولة برضو؟

تصحيحات بتضيع وقتك

واضح إن تعديل البيانات عشان تخليها متناسقة في الجدول بياخد وقت كبير. دا بيكون من أكبر الآثار السلبية لعدم تناسق البيانات على سير عملك. بيخليك تستغل وقتك في تعديل الأخطاء القديمة بدل ما تركز على الشغل الجديد. بتضطر تضيع وقتك بسبب أخطاء فنية من أفراد.

في مثال تاني عشان نوضح ازاي التعديلات على البيانات الغير متناسقة بتأخد وقت طويل، لو فرضنا إنك بتستخدم اسم الولايات المتحدة الأمريكية في الجدول الخاص بيك، فإزاي بتستخدم الاسم دا؟ بتقدر تستخدم “الولايات المتحدة” كاملة أو “أمريكا” أو “USA“، الاختيار ده بتاعك. لكن لو استخدمت كل واحدة منهم في الجدول، فالبلد هي نفسها، بس المدخلات مختلفة. وبالتالي، لو بحثت عن واحدة منهم، مش هتلاقي الباقي.

الحل هو إنك ترجع لكل مرة استخدمت فيها إسم واحد من الخيارات دي وتعدله. يعني لازم تحدد واحدة من الخيارات وتستخدمها بس، عشان تتفادى اللخبطة، خصوصًا لو كنت بتشتغل على نفس الجدول مع زمايلك في الشغل. عشان تتجنب أي ارتباك، قبل ما تدخل البيانات، لازم تحدد إسم معين للاستخدام.

نقل البيانات ودمجها في أنظمة بيانات تانية

كل برنامج وتطبيق بيكون عنده نظام خاص بيه لإدخال البيانات ومعالجتها. ده اللي بيخلي النقل بين أنظمة بيانات مختلفة صعب جدًا، وممكن مايشتغلش النظام كويس. يعني لو مثلا عندك موقع إلكتروني لبيع الملابس، وعايز تحمّل قاعدة بياناتك على نظام ERP بصيغة .xlsx. البضاعة اللي بتبيعها بتيجي بخيار “Extra Large” برضو. فإزاي هتعرض الخيار ده في النظام الجديد؟

لو نقلت البيانات بتاعتك وشوفت كل الملابس وخيارات المقاسات اللي عندك، هتلاقي كلمات مختلفة زي “XL“، “XLarge“، “Xtra Large” وهكذا. الإصدارات والإدخالات المختلفة لنفس البيانات بتخلي النظام غير منظم وفوضوي لما تنقل البيانات لنظام تاني. لو عايز تتجنب الفوضى، لازم تقرر استخدام إصدار واحد بس للكلمات دي. بالإضافة لكده، اتأكد إن كل موظف يقدر يضيف أو يحدّث البيانات عارف إيه الإصدار اللي تم اختياره.

إزاي تمنع عدم تطابق البيانات في جداول إكسل

إزاي تمنع مشاكل عدم تطابق البيانات والتناقضات في ملف إكسل؟
إزاي تمنع عدم تطابق البيانات في جداول إكسل

في طرق مختلفة واللي ممكن تستخدمها علشان تمنع إنشاء قاعدة بيانات غير متطابقة، سواء كان قبل أو وقت عملية إدخال البيانات. في طرق بسيطة وأساسية وطرق تانية بتحتاج إنك تتنازل عن بعض المفاهيم في مجالات تانية. تعالي اعرفك علي بعض من الطرق اللي ممكن تستخدمها عشان تتجنب عدم التطابق والتباين في البيانات.

تحديد حدود إدخال البيانات يدويًا

بيكون دايمًا فيه بيانات بيتم إدخالها يدويًا في قواعد البيانات. مفيش حل لده. بس اللي ممكن تعمله إنك تحد من إدخال البيانات يدويًا علشان تحافظ على تطابق البيانات. لإن الناس بتخطئ. حتى لو كان الشخص اللي بيدخل البيانات متخصص ومحترف، هو بيخطئ. ده واحد من عيوب طريقة إدخال البيانات النصية المفتوحة.

بتقليل عدد البيانات اللي بتدخل يدويًا والسماح للعملية الآلية إنها تأخد مكانها، هتقلل عدد الأخطاء. ودي بتتطبق على كل الأطراف. الشركة (يمكن البائع) وكمان العميل (المشتري)، كلهم لازم يفكروا في إن الآلة هتساعدك تتجنب الأخطاء في الجدول. وتقدر تحزر على واحد من أكتر الأخطاء اللي بتحصل؟ عدم التطابق.

المرونة

يعني الطريقة دي بتقلل المرونة بدل ما تزودها. قبل كده ولحد دلوقتي في بعض المناطق، كان الزبون والشركة بيملوا استمارات ورقية لكل عملية. الطريقة دي بالورقة والقلم بتخلي العملية أكتر عرضة للأخطاء، وبالتالي بيحصل عدم اتساق في البيانات.

لكن، بتقييد المرونة وإجبار الشركات والعملاء على اختيار مجموعة “محددة مسبقًا” من البيانات، بيتم تقليل فرص الأخطاء. كل ما زاد حرفية الشخص في كتابة النص، زادت الأخطاء وعدم الاتساق في قاعدة البيانات.

قوالب إكسل جاهزة للاستخدام

قوالب الاكسل الخاصة بجهات خارجية بتخفف بعض المسؤوليات عنك عشان تقدر تركز على بياناتك. معظم القوالب بتقوم بتأسيس الأتمتة لإدخال ومعالجة بياناتك، وده بيقلل من خطر عدم التوافق فيها.

إزاي تقدر تصلح عدم اتساق البيانات في جدول إكسل؟

في البداية، حاولت تمنع الأخطاء وعدم الاتساق في البيانات، وبعد كده ممكن تحصل أخطاء وعدم اتساق. دلوقتي لازم تحاول تصلح الأخطاء دي. برغم كده، لازم يكون فيه تدخل بشري عشان المعالج الرقمي يقدر يحدد الأخطاء ويعدل الإعدادات. الكمبيوتر اللي بيعالج وبيحدد اتساق البيانات لازم يكون قادر يحدد الفرق ما بين “التغير” و “الخطأ”. خلينا مثلا نستخدم ‘Company Inc.’ كمثال توضيحي:

‘Company Inc.’ و ‘Company INC.’ معناهم واحد ، وهو اسم الشركة. لكن دلوقتي، لازم تدخل البيانات المطلوبة في البرنامج عشان تقول إنهم نفس الحاجة. لازم تحدد الإصدارات والتغييرات المختلفة لـ Company Inc عشان تخلي البيانات اتساقها وتقاريرها دقيقة.

لكن، لو حطيت ‘Company Inc.’ و ‘Companyy Inc.’,، إيه اللي بيحصل؟ واضح إنه ده غلط كتابي وغلط جوهري. لو مخدش بالك من ده، فهو مش هيمر على الكمبيوتر كمان. في المثال ده، لازم تدخل البيانات اللازمة إن غير كلمة ‘Company’ بالكلمة المختلفة كلها غلط.

بصراحة، ده خطأ غير واضح إلى حد ما، وممكن تعدله لو عايز تحدد ايه هو الـ ‘variation’ للبيانات وايه هو الـ ‘inconsistency mistake’. فمن الصعب تحديد قواعد وإعدادات محددة للكل بخصوص اتساق البيانات. عشان كده، لازم تحدد قواعدك الخاص.

الدقة في إدخال البيانات بتضمن الدقة في النتائج.

المنطق الضبابي

ده بيبقى زي الخطأ اللي مش واضح، وبيستخدم في المجالات اللي بيدرسوا فيها الرياضيات وهندسة الحاسوب وفي الوقت ده في مجال الذكاء الاصطناعي. المنطق الضبابي بياخد القيم اللي بين الصفر والواحد وبيخلطهم مع بعض عشان يخلي كل متغير بين قيمة صفر وواحد بس. وده بيتطبق على البيانات الرقمية في المجالات اللي ذكرناها. بس في المقابل، متاح استخدام المنطق الضبابي على البيانات اللي فيها حروف وكلمات.

الجزء المهم جدًا في الموضوع ده هو التعديل. لازم تعدل وتدخل قواعدك ومبادئك الخاصة لنقطة الصفر والواحد. عشان كل حاجة بينهم بتتحول لواحد، فالتحكم في القيود والحدود في قاعدة البيانات الخاصة بيك بيكون مهم جدًا. ومن خلال التعديل ده، هتقدر تدمج النصوص اللي شبه بعضها في خلية واحدة أو في جدول البيانات أو حتى في ملف Excel.

مهم: تحليل البيانات باستخدام إكسل

في الختام

مش كل حاجة غلط في بياناتك اللي الكمبيوتر بيعالجها بيتعرف عليها. ومش هتقدر تضمن إنك تلاقي كل الغلط وعدم التساوي في البيانات بنسبة 100%. الأحسن ليك إنك تجمع بين الإتنين. بتخفف من الإدخال اليدوي وتمنع حدوث الأخطاء وعدم التساوي، هتساعد الكمبيوتر يشتغل بطريقة أفضل. بتساعد المعالج يطلع نتايج دقيقة بناءًا على بياناتك. كمان بتساعد الناس اللي شغالة معاك على نفس الجدول. وأكيد بتساعد نفسك كمان.

ده زي سلسلة ردود فعل إيجابية. لو كنت حريص أكتر على طريقة إدخال البيانات، هتقدر تتجنب التساوي في البيانات. لو بتقلل التساوي والأخطاء، هتوفر وقت وطاقة. الوقاية من مشاكل التساوي في بيانات الإكسل بتبتدي منك وبتفيدك في النهاية.

كل فيديو ومقال بينقلك لخطوة جديدة في رحلتك المهنية

تابعنا دايمًا ومتترددش تتواصل معانا لو عندك أي استفسار.

يالا بينا

باش محاسب هو المنتور اللي هيساعدك تتقدم في كاريرك، سواء كنت طالب أو محاسب جديد أو حتى محترف بتدور على تطوير مهاراتك.

الاتصال بنا

استفسارات عامة

01090162071

العلامة التجارية وجميع الحقوق محفوظة © 2024 | برمجة وتصميم elsayed ghibaish