خدمة تلخيص النصوص العربية أونلاين،قم بتلخيص نصوصك بضغطة واحدة من خلال هذه الخدمة
حيث تختبر هذه الدراسة نماذج التعلم الآلي المراقبة بما في ذلك شبكة التحليل التكراري (RNN)، حيث تعمل بشكل نسبي أفضل من النموذج غير المراقب ونموذج التصنيف السرجي القائم على الاحتمالات التقليدية. يناسب النهج العميق للتعلم الآلي اللغة الكورية بشكل أفضل من النماذج غير المراقبة المعتمدة على المعاجم لعدة أسباب، وتحاول الدراسة تطبيق تحليل المشاعر على السياسة الكورية، مما يشير إلى أن البيانات اللغوية للنموذج غير المراقب يجب أن تتناسب مع السياق السياسي في كوريا الجنوبية، ثانياً التحليل الصرفي صعب للغة الكورية لأنها لغة اشتقاقية (حيث يمكن أن يتغير معنى الكلمة اعتمادًا على الكلمة المضافة المجاورة). ويعتبر التضمين عملية لتحويل الكلمات إلى موجهات يمكن للكمبيوتر فهمها، ويشير حجم التضمين إلى بُعدية متجهات التضمين وهو عامل مرتبط بدقة تعقيد اللغة الطبيعية، وتستخدم هذه الدراسة أحجام تضمين قدرها 100 و200 و300 (BERT هو نموذج مدرب مسبقًا يتضمن نوعًا فريدًا من التضمين وبُعدًا مُعينًا)، ويعد نموذج BERT هو منهجية مدربة مُسبقًا، وتطبق هذه الدراسة عملية تحويل التعلم على منهجية kobert لعمل تصنيف المشاعر السياسية الخاصة بالنصوص الكورية على تويتر، وهذا يعني أن الشبكة تميز إما بين إيجابي وسلبي أو بين إيجابي ومحايد وسلبي. الخلاصة هناك ثلاثة أنواع من التضمين بثلاثة أحجام بُعدية وثلاث شبكات عصبية بخياري تصنيف، وفيما يلي تؤدي نوعين من التضمين، وثلاثة أبعاد من التضمين وثلاث شبكات عصبية وفئتي تصنيف إلى مجموع 26 من التجميعات للاختبار (تستخدم الدراسة Python لمعالجة بيانات تويتر مسبقًا وPyTorch لبناء الشبكات العصبية، يطبق نتيجة الاختبار التسلسلي الأنسب للجهاز ويحصل على المشاعر اليومية من جميع التغريدات المجمعة في عام 2019 واختبار، بينما تُستخدم المجموعات الأخرى للتحقق والاختبار والتي تقيس جدوى النظام أثناء التدريب وفي نهايته، وبالتالي لا يتغير حتى انتهاء تدريب المنهجية، ووفقًا لدرجات الدقة في الجدول 2، أي تقليل فئة التصنيف يحسن الدقة في جميع التجميعات، 7 لتحديد ما إذا كانت التغريدة تكشف عن المشاعر، 92٪ على مجموعة الاختبار، 08٪ من نموذج RNN. على سبيل المثال، FastText، Word2Vec هو توافق أفضل مع CNN، بينما يعطي FastTrack نتائج أفضل بشكل عام مع RNN، وبشكل عام لا توجد فروع متميزة من حيث الدقة التي تتغير اعتمادًا على تركيبات العناصر المختلفة. وتحلل هذه الدراسة مشاعر جميع التغريدات المجمعة في عام 2019 باستخدام نموذج BERT المخصص للتصنيف بين فئتين. ومن بين الفروع التي تم اختبارها، يُحقِّق BERT نتائج دقة عالية لجميع المهام المعطاة مع أداء مستقر نسبيًا، ويعتبر BERT هو أكثر شبكة عصبية متقدمة بين الأنظمة التي تم اختبارها في التحليل ومصمم للتعامل مع البيانات التسلسلية المعقدة مثل اللغات الطبيعية، فهو النظام الأكثر بساطة في التنفيذ في مهمة تصنيف المشاعر مقارنة بالآخرين، وبشكل عام تتضمن الدراسة عملية تسلسلية لاستخراج الرأي العام عبر الإنترنت، أولاً يقوم الجهاز تلقائيًا بجمع النصوص التي ينشئها المستخدمين عبر تويتر في هذه الدراسة حول موضوع معين لفترة زمنية معينة، وتحدد الأغلبية القاعدة النهائية لتصنيف المشاعر للنص، ثالثًا تدرب البيانات المشفرة نموذج تعلم عميق لبناء تصنيف المشاعر، وأخيرًا يتم تجميع النصوص ذات الرأي الواحد المجمع،
-2. المنهجيات
يمكن للمنهجيات غير المراقبة والمراقبة أن تصنف المشاعر كما هو موضح في نقد الدراسة، حيث تختبر هذه الدراسة نماذج التعلم الآلي المراقبة بما في ذلك شبكة التحليل التكراري (RNN)، وشبكة التحليل التراكمي المغلقة (CNN)، وBERT، حيث تعمل بشكل نسبي أفضل من النموذج غير المراقب ونموذج التصنيف السرجي القائم على الاحتمالات التقليدية.
يناسب النهج العميق للتعلم الآلي اللغة الكورية بشكل أفضل من النماذج غير المراقبة المعتمدة على المعاجم لعدة أسباب، أولاً لا يوجد لدى اللغة الكورية قاموس واضح لتحليل المشاعر، وتحاول الدراسة تطبيق تحليل المشاعر على السياسة الكورية، مما يشير إلى أن البيانات اللغوية للنموذج غير المراقب يجب أن تتناسب مع السياق السياسي في كوريا الجنوبية، ثانياً التحليل الصرفي صعب للغة الكورية لأنها لغة اشتقاقية (حيث يمكن أن يتغير معنى الكلمة اعتمادًا على الكلمة المضافة المجاورة).
وتهتم الدراسة بنوع التضمين، حجم التضمين والشبكة العصبية لأداء التعلم المراقب وتحديداً التعلم العميق، ويعتبر التضمين عملية لتحويل الكلمات إلى موجهات يمكن للكمبيوتر فهمها، ويتم تنفيذ هذا التحويل بطرق مختلفة، حيث تستخدم الدراسة Word2Vec وFastText، ويشير حجم التضمين إلى بُعدية متجهات التضمين وهو عامل مرتبط بدقة تعقيد اللغة الطبيعية، وتستخدم هذه الدراسة أحجام تضمين قدرها 100 و200 و300 (BERT هو نموذج مدرب مسبقًا يتضمن نوعًا فريدًا من التضمين وبُعدًا مُعينًا)، وتعتبر الشبكة العصبية هي منهجية تعلم عميق مراقب تعمل كتكرار بسيط للدماغ البشري، و تختبر الدراسة ثلاث شبكات عصبية رئيسية: CNN وRNN وBERT. (تطبق الدراسة وحدة التكرار التسلسلي المُعرَّبة (GRU) من خلال RNN وتنفذ تعديلًا على نموذج BERT من خلال إضافة طبقات خطية في النهاية، للحصول على شرح مفصل لجميع الشبكات العصبية المستخدمة في الاختبار، يشرح LeCun CNN، ويقدم Cho وآخرون منهجية GRU لـ RNN، ويوضح Vaswani وآخرون BERT)، ويعد نموذج BERT هو منهجية مدربة مُسبقًا، وتطبق هذه الدراسة عملية تحويل التعلم على منهجية kobert لعمل تصنيف المشاعر السياسية الخاصة بالنصوص الكورية على تويتر، وأخيرًا تختبر هذه الدراسة مجموعتين وثلاث مجموعات تصنيفات؛ وهذا يعني أن الشبكة تميز إما بين إيجابي وسلبي أو بين إيجابي ومحايد وسلبي. عندما تُدرَّب الشبكة لتنفيذ تصنيف مزدوج، تصبح التغريدات غير المُصنَّفة محايدة، الخلاصة هناك ثلاثة أنواع من التضمين بثلاثة أحجام بُعدية وثلاث شبكات عصبية بخياري تصنيف، ويمكن أن تؤدي تلك التجميعات لمستويات دقة مختلفة للنموذج المدرَّب، وفيما يلي تؤدي نوعين من التضمين، وثلاثة أبعاد من التضمين وثلاث شبكات عصبية وفئتي تصنيف إلى مجموع 26 من التجميعات للاختبار (تستخدم الدراسة Python لمعالجة بيانات تويتر مسبقًا وPyTorch لبناء الشبكات العصبية، يستخدم عملية التضمين حزمة Gensim من خلال Python)، يطبق نتيجة الاختبار التسلسلي الأنسب للجهاز ويحصل على المشاعر اليومية من جميع التغريدات المجمعة في عام 2019
تتضمن الجدول 2 الأرقام الدقيقة لجميع تجميعات المعلومات.
يتطلب التعلم المراقب ثلاث مجموعات بيانات: تدريب، تحقق، واختبار، تقسم هذه الدراسة البيانات الكاملة إلى نسب ثلاثة: 75٪، و12.5٪، و12.5٪، الجزء الأكبر مخصص لتدريب الشبكة، بينما تُستخدم المجموعات الأخرى للتحقق والاختبار والتي تقيس جدوى النظام أثناء التدريب وفي نهايته، وتحدث عملية التحقق اثناء التدريب باستخدام مجموعة بيانات معدة مسبقا لفحص ما اذا كانت المنهجية مناسبة للتعلم من البيانات، بينما تستخدم مجموعة الاختبار لفحص الأداء النهائي للنموذج المدرَّب، وبالتالي لا يتغير حتى انتهاء تدريب المنهجية، ويتم استنتاج درجة الدقة التي تشير الى نسبة بيانات التنبؤ الدقيق من مجموعة الاختبار وتحدد أداء منهجية التحليل.
ووفقًا لدرجات الدقة في الجدول 2، تحقق الشبكات نتائج أفضل في مهمة التصنيف بين فئتين؛ أي تقليل فئة التصنيف يحسن الدقة في جميع التجميعات، وتحدد الدراسة عتبة الاحتمال بقيمة 0.7 لتحديد ما إذا كانت التغريدة تكشف عن المشاعر، ويحقق نموذج BERT أفضل نتيجة في مهمة التصنيف بين ثلاث فئات بدقة تصل إلى 84.92٪ على مجموعة الاختبار، وبالنسبة للتصنيف بين فئتين، تكون أفضل شبكة هي RNN مع Word2Vec، وببُعد 300، بنسبة 94.26٪. نموذج BERT يحقق دقة 94.18٪، وهو أقل بنسبة 0.08٪ من نموذج RNN. لا تضمن أبعاد تضمين أكبر أداءً أفضل. على سبيل المثال، يميل CNN بحجم تضمين 200 إلى الحصول على دقة أعلى باستثناء تجميعة RNN، FastText، وببُعد 100 في مهمة التصنيف بين فئتين، وبين Word2Vec وFastTrack، لا يمكن استنتاج ما إذا كان التضمين الخاص بتحديد هذا المشروع للتصنيف العاطفي أفضل. Word2Vec هو توافق أفضل مع CNN، بينما يعطي FastTrack نتائج أفضل بشكل عام مع RNN، وبشكل عام لا توجد فروع متميزة من حيث الدقة التي تتغير اعتمادًا على تركيبات العناصر المختلفة.
وتحلل هذه الدراسة مشاعر جميع التغريدات المجمعة في عام 2019 باستخدام نموذج BERT المخصص للتصنيف بين فئتين.، ومن بين الفروع التي تم اختبارها، يُحقِّق BERT نتائج دقة عالية لجميع المهام المعطاة مع أداء مستقر نسبيًا، ويعتبر BERT هو أكثر شبكة عصبية متقدمة بين الأنظمة التي تم اختبارها في التحليل ومصمم للتعامل مع البيانات التسلسلية المعقدة مثل اللغات الطبيعية، كما أنه مدرَّب مسبقًا بطريقة تجعله لا يتطلب مكونات إضافية مثل التضمين، فهو النظام الأكثر بساطة في التنفيذ في مهمة تصنيف المشاعر مقارنة بالآخرين، وبشكل عام تتضمن الدراسة عملية تسلسلية لاستخراج الرأي العام عبر الإنترنت، أولاً يقوم الجهاز تلقائيًا بجمع النصوص التي ينشئها المستخدمين عبر تويتر في هذه الدراسة حول موضوع معين لفترة زمنية معينة، ثانيًا يحدد الأشخاص المشفرون مشاعر النماذج النصية دون تنسيق، وتحدد الأغلبية القاعدة النهائية لتصنيف المشاعر للنص، ثالثًا تدرب البيانات المشفرة نموذج تعلم عميق لبناء تصنيف المشاعر، وتختبر الدراسة منهجيات مختلفة بعوامل متنوعة بما في ذلك نوع التضمين وحجمه، ويتم تنفيذ نموذج KoBERT المعدَّل لتحليل النصوص الكورية التي يُنتجها المستخدم ضمن سياق سياسي، وأخيرًا يتم تجميع النصوص ذات الرأي الواحد المجمع، وتقارن الدراسة إحصائيًا بين المشاعر على الإنترنت والرأي العام في الواقع حول قضية مماثلة لفحص تفرد الرأي العام على الإنترنت.
تلخيص النصوص العربية والإنجليزية اليا باستخدام الخوارزميات الإحصائية وترتيب وأهمية الجمل في النص
يمكنك تحميل ناتج التلخيص بأكثر من صيغة متوفرة مثل PDF أو ملفات Word أو حتي نصوص عادية
يمكنك مشاركة رابط التلخيص بسهولة حيث يحتفظ الموقع بالتلخيص لإمكانية الإطلاع عليه في أي وقت ومن أي جهاز ماعدا الملخصات الخاصة
نعمل علي العديد من الإضافات والمميزات لتسهيل عملية التلخيص وتحسينها
إيميل A FORMAL EMAIL که تحمل From: Antonio Ricci [[email protected]] The Priory Language Sch...
لم يتفق الباحثون على تعريف جامع للشيخوخة، وذلك لأنها ليست من الظواهر الثابتة التي تحدث في المراحل ال...
وتناولت دراسة (فياض، والزائدي 2009) الأزمة المالية العالمية وأثرها على أسعار النفط الخام، تناولت بش...
تعتبـــر التغذية الصحية مهمة جدا خلال الســـنتين الاولى من عمر الطفل حيث يتطور النمو العقلي والجســـ...
ﻦ ﷲ، إﻻ إﻟﮫ ﻻ ﯾﺎﻣﻮﺳﻰ: ﻗُﻞ ْ ﻗﺎل: ﺑﮫ، وأدﻋُﻮك َ أذﻛﺮُك َ ﺷﯿﺌًﺎ ﻋَﻠﱠﻤﻨﻲ ؟ ھﺬا ﯾﻘﻮﻟﻮن ﻋ ِ ﺒﺎدِك َ ﻛﻞ ﱡ ...
معايير التقييم الأساسية المهارة النسبة الفهم السمعي 20% التعبير الشفهي 25% القراءة والفهم 20% الكت...
التحسّس المبكّر لأمراض الكلى ضروري لمنع أو تأخير تطور المرض إلى مراحله النهائية. يشتمل التشخيص المبك...
عـهـدنـا كـنـزنـا حلم سـيـنــمـو فـينـا درب طـويــل و عـزمـنـا جــبـال فــيـنــا اهـدؤوا و ابـدؤو...
تحسن معدلات النجاة عالميًا: بفضل برامج التطعيم، وتحسن الرعاية الصحية الأولية، وانخفاض معدل الفقر. ...
. أوبين فلم إطا الوية واماعلى الإساة غير عاوية زى بلغ الزاع ر الهدة والتظيم تجلد خاضأو لأحكام القانو...
I have a request: whenever we make an appointment and it's an automated call reminder about the appo...
• في الدعائم ذات البنية المغلقة أو الشكل المصمت، يقتصر التحلل غالباً على السطح الخارجي، ما يؤدي إلى ...