ما هي القفزات (Hops)، لماذا «تَهْلُس» نماذج اللغة الضخمة، وكيف يعالجها رسمُ المعرفة؟

ملخّص تنفيذي

القفزة (Hop) هي خطوة اجتياز واحدة على رسم المعرفة من كيانٍ إلى آخر عبر علاقة محدَّدة.
نماذج اللغة الضخمة (LLMs) تُبدِع في فهم النص لكنها تُخطئ أحياناً باختراع «حقائق» — وهو ما يُعرف بالهلوسة.
بدمج هذه النماذج مع رسم معرفة طبي مثل UMLS يمكننا تزويدها بمسارات موثوقة (هوب 0، هوب 1، هوب 2…) فتقلُّ الهلوسة ويزداد الشرح والتعليل. أدناه شرح مبسَّط مع أمثلة طبية.


١. تعريف UMLS

UMLS ‎(Unified Medical Language System) هو مشروع من المكتبة الوطنية الأمريكية للطب يوحّد أكثر من ‎180‎ معجماً ومخطط ترميز طبي في بنية واحدة.
يوفّر ما يلي:

  • ٤٫٥ مليون مفهوم طبي (CUIs)
  • ١٥ مليون علاقة دلالية مقيّدة (يعالج، يسبّب، تفاعل-دوائي، …).
  • طبقة علاقات واضحة تجعل الرسوم البيانية الطبية مثالية للاسترجاع المتعدِّد القفزات.

٢. ما هي القفزات (Hops

| القفزة | الوصف | مثال طبي | |——–|——-|———-| | 0-Hop | الكيان الأصلي نفسه | «حمّى» | | 1-Hop | عقدة مرتبطة مباشرة | «حمّى» → عارِض لـ → «عدوى بكتيرية» | | 2-Hop | عقدتان متتاليتان | «حمّى» → عدوى بكتيرية → يعالج بـ → «سيفترياكسون» | | 3-Hop | ثلاث عقد | «ديابيتس» → اعتلال كُلوي → يؤدّي إلى → «غسيل كلوي» → يعرّض لـ → «عدوى قثطار» |


٣. مشكلة الهلوسة في LLM

  • «الهلوسة» = إنتاج معلومات خاطئة أو مختلقة بثقة عالية.
  • تزداد عندما يفتقر النموذج إلى معرفة دقيقة أو مسار سببي واضح.
  • في الحقل الطبّي، قد يقترح النموذج دواءً متعارضاً مع حالة المريض (مثال: إيبوبروفين + ألوبيورينول لدى مريض قصور كلوي).

٤. كيف يساعد رسم المعرفة؟

  1. استرجاع مسار موثوق: الأنظمة من نوع RAG تبحث في الرسم أولاً ثم تُعطي الـ LLM المسارات كبديهيات.
  2. تقليل الهلوسة: النموذج يقيّد نفسه بالحقائق المُسترجَعة بدلاً من الاعتماد على الاحتمالات اللغوية فقط.
  3. شرح قابل للتدقيق: كل جواب يأتي مع سلسلة القفزات (Chain-of-Thought) ليستطيع الطبيب التحقق منها.

٥. كيف عالجت الورقتان مفهوم القفزات؟

| العنصر | KG-RAG (QA) | DR.KNOWS (تشخيص) | |——–|—————–|———————-| | الرسم المستخدم | قاعدة أفلام (MetaQA) | UMLS الصِرف مع علاقات منتقاة (107 علاقة) | | أقصى عمق | اختبار 1-3 Hops؛ اعتمدوا ‎3‎ لتغطية كل الأسئلة | غالباً 1-2 Hops مع تصنيف المسارات بالأهمية | | تأثير القفزات | +15 ٪ بالدقّة في أسئلة 2-Hop | +4 نقاط F1 للتشخيص بعد إضافة المسارات | | أسلوب التقييم | Hit@1 لسؤال-جواب | ROUGE & CUI-F1 وتقييم بشري للمنطق |


٦. مثال طبّي كامل

معلومات المريض

حمّى 38 °، سعال، قصور كلوي مزمن (St 4)، يتناول ألوبيورينول.

المفاهيم المستخرجة
C0037088 حمّىC0032285 ذات رئةC0022661 CKDCIP_3400935508802 ألوبيورينول.

مسارات الرسم

  1. CKD → يمنع → إيبوبروفين (1-Hop)
  2. CKD → احتياج جرعة → سيفترياكسون (1-Hop)
  3. ذات رئة ← يسبِّب ← حمّى (1-Hop)

خلاصة النموذج

التشخيص الأرجح: التهاب رئوي جرثومي.
⚠︎ إيبوبروفين ممنوع بسبب CKD.
✔ سيفترياكسون آمن بجرعة معدَّلة.
[Reasoning] تمّ استنتاج ذلك عبر المسارات 1-3 أعلاه.


٧. دمج القفزات في نظام دوائي

  1. مواءمة المعرفات: ربط CUIs مع أكواد CIP/ATC.
  2. جملة استعلام: MATCH (s:Symptom {cui:$cui})-[:CAUSES*1..2]->(d:Disease) لإيجاد أمراض في قفزة أو اثنتين.
  3. حقن المسارات في الـ Prompt أمام الصيدلي أو الطبيب.
  4. عرض الشرح مع روابط نشطة إلى بطاقة التطبيق للدواء.

٨. الخاتمة

القفزات هي اللبنات التي تبني مساراً تفسيريّاً واضحاً. بوجود رسم معرفة غني (UMLS) يمكننا تزويد LLM بمسارات سببية مثبتة، فيتراجع خطر الهلوسة ويزداد الاعتماد السريري على الأنظمة الذكية.


المراجع المختصرة

  1. KG-RAG 2025 (arXiv:2504.08893)
  2. DR.KNOWS – JMIR AI 2025;4:e58670
  3. Ji Z. et al. “Survey of Hallucination in NLG”, 2023
  4. Zhao T. et al. “LLMs × Knowledge Graphs”, 2024
Share: X (Twitter) Facebook LinkedIn