الماضي والحاضر والمستقبل لنظرية الإدراك في التعلم متعدد الوسائط The Past, Present, and Future of the Cognitive Theory of Multimedia Learning

المجلة: Educational Psychology Review، المجلد: 36، العدد: 1
DOI: https://doi.org/10.1007/s10648-023-09842-1
تاريخ النشر: 2024-01-17

الماضي والحاضر والمستقبل لنظرية الإدراك في التعلم متعدد الوسائط

ريتشارد إي. ماير (د)

تم القبول: 25 ديسمبر 2023 / نُشر على الإنترنت: 17 يناير 2024
© المؤلفون 2024

الملخص

نظرية التعلم المتعدد الوسائط المعرفية (ماير، 2021، 2022)، التي تسعى لشرح كيفية تعلم الناس للمواد الأكاديمية من الكلمات والرسوم البيانية، قد تطورت على مدى الأربعة عقود الماضية. على الرغم من أن اسم النظرية وتمثيلها الرسومي قد تطورا على مر السنين، إلا أن الأفكار الأساسية ظلت ثابتة – قنوات مزدوجة (أي أن البشر لديهم قنوات معالجة معلومات منفصلة للمعلومات اللفظية والمرئية)، سعة محدودة (أي أن سعة المعالجة محدودة بشدة)، ومعالجة نشطة (أي أن التعلم المعنوي يتضمن اختيار المواد ذات الصلة ليتم معالجتها في الذاكرة العاملة، وتنظيم المواد عقليًا في هياكل لفظية ومرئية متماسكة، ودمجها مع بعضها البعض ومع المعرفة ذات الصلة المفعلة من الذاكرة طويلة المدى). تصف هذه المراجعة كيف تطورت النظرية (أي، الماضي)، والحالة الحالية للنظرية (أي، الحاضر)، والاتجاهات الجديدة للتطوير المستقبلي (أي، المستقبل). بالإضافة إلى ذلك، تتضمن المراجعة أمثلة على الأحداث والنتائج التي أدت إلى تغييرات في النظرية. يتم مناقشة الآثار المترتبة على علم النفس التربوي، بما في ذلك 15 مبدأً قائمًا على الأدلة لتصميم الوسائط المتعددة.

الكلمات الرئيسية التعلم متعدد الوسائط تطوير النظرية نظرية التعلم تصميم التعليم التعلم ذو المعنى

مقدمة في نظرية التعلم المتعدد الوسائط المعرفية

تمثل نظرية التعلم المتعدد الوسائط المعرفية (CTML) محاولتي المستمرة والمتطورة لفهم كيفية عمل التعلم المعنوي. يحدث التعلم المعنوي عندما يشارك المتعلم في معالجة معرفية مناسبة أثناء التعلم، بما في ذلك الانتباه إلى المعلومات ذات الصلة في الدرس (أي، الاختيار).
تنظيم المعلومات الواردة عقليًا في هيكل معرفي متماسك (أي، التنظيم)، وربطها بالمعرفة ذات الصلة التي تم تنشيطها من الذاكرة طويلة المدى (أي، الدمج؛ ماير، 2021، 2022). يتم الإشارة إلى التعلم المعنوي من خلال الأداء في اختبارات النقل، والتي تتضمن القدرة على استخدام المادة المتعلمة في مواقف جديدة. يركز نموذج التعلم المعرفي متعدد الوسائط على كيفية تعلم الناس بشكل معنوي من المواد الأكاديمية التي تحتوي على كلمات ورسوم بيانية. يركز على التقنيات التي تهيئ المعالجة المعرفية المناسبة أثناء التعلم.
تتأثر تطوير نظريات جديدة مثل CTML بالنظريات الموجودة. على سبيل المثال، يشير كامب وآخرون (2022) إلى أن CTML يبني على الأطر المفاهيمية الكلاسيكية من علم النفس المعرفي، بما في ذلك نظرية الترميز المزدوج (بايفيو، 1986)، ونموذج الذاكرة متعدد المراحل (بادلي، 1986)، ونظرية الحمل المعرفي (سويلر، 1999، قيد النشر؛ سويلر وآخرون، 2011). على وجه الخصوص، يلاحظ كامب وآخرون (2022، ص. 17):
قوة النظريات تكمن في أنها تمتلك القدرة على البقاء صالحة وذات صلة عبر الأجيال، بينما قوة النظريات الجديدة تكمن في أنها تبني على تلك النظريات القديمة وتوسعها. يمكنك أن تقول إن النظريات القديمة هي العمالقة الذين يقف على أكتافهم النظريات الجديدة، وبالتالي العمالقة الجدد. يمكن اعتبار نظرية التعلم المتعدد الوسائط المعرفية (CTML) … واحدة من هؤلاء العمالقة الجدد.
إن إنشاء CTML هو بالتأكيد جهد جماعي في مجال علم النفس التربوي. هدفي المتواضع في هذه المقالة هو مشاركة بعض الرؤى التمهيدية التي استخلصتها من جهودي في بناء النظرية على مدى العقود الماضية، ووصف تطور CTML، وتلخيص الحالة الحالية لـ CTML، والتكهن بالاتجاهات المستقبلية المحتملة لـ CTML. أولاً، تماشياً مع دعوة غرين (2022) لفحص عملية تطوير النظرية في علم النفس التربوي بعناية، أشارك سبع رؤى حول بناء النظرية التي تتجلى في محاولاتي التي استمرت لعقود لشرح كيفية تعلم الناس من دروس الوسائط المتعددة.

الرؤية 1: بناء النظرية يعتمد على الفضول الفكري

CTML هو تجسيد لرحلتي الطويلة لفهم كيفية عمل التعلم المعنوي. بدأت رحلتي في أحد تلك الأيام الخريفية الرائعة في آن آربر في عام 1969، عندما بدأت مسيرتي الدراسية في علم النفس في جامعة ميتشيغان. سرعان ما تطورت لدي فضول عميق حول كيفية عمل التعلم المعنوي خلال عامي الأول في الدراسات العليا، تحت إشراف جيمس غرينو. كيف يمكننا التدريس بحيث يتمكن الناس من أخذ ما تعلموه واستخدامه بشكل منتج في مواقف جديدة؟ لقد كانت هذه السؤال البسيط الظاهر حول التدريس من أجل النقل قوة دافعة في مختبري لأكثر من أربعة عقود. بشكل محدد، يركز CTML على بعض الأسئلة الأساسية حول التعلم والتعليم باستخدام المواد متعددة الوسائط: كيف يتعلم الناس المواد الأكاديمية التي تتكون من كلمات ورسوم بيانية (أي، التعلم متعدد الوسائط)؟ كيف يمكننا مساعدة الناس على تعلم المواد الأكاديمية التي تتكون من كلمات ورسوم بيانية (أي، تصميم التعليم متعدد الوسائط)؟ إن فضولي حول هذه الأنواع من الأسئلة هو المحرك الذي يدفع تطوير CTML.
كيف بدأت في هذه الرحلة لتطوير النظريات؟ خلال سنتي الأولى في دراسات العليا، بينما كنت أواجه صعوبة في بناء هويتي كباحث
كعالم نفس، حظيت بفرصة جيدة لأخذ دورة بعنوان نماذج التفكير، التي قام بتدريسها مستشاري، جيم غرينو. جعلتني هذه الدورة أفكر في كيفية قدرة الناس على التوصل إلى حلول إبداعية للمشكلات، مما قادني إلى سؤال أساسي: “كيف يمكننا مساعدة الناس على التعلم بطرق تمكنهم من أخذ ما تعلموه وتطبيقه على مواقف جديدة؟” هذا السؤال حول التعليم من أجل النقل، الذي تشكل في ذهني خلال تلك الدورة، ظل معي طوال هذه السنوات وقد دفع أبحاثي. اكتشفت قريبًا أن هذه قضية كلاسيكية، وإن كانت مراوغة، في كل من علم النفس والتعليم تعود إلى الأيام الأولى من البحث في التعلم والتعليم.

الرؤية 2: بناء النظرية مستند إلى أفكار قديمة

البحث عن نظريات التعلم المعنوي له تاريخ طويل، بما في ذلك الأعمال البصيرة لعلماء النفس الجشتالت مثل ويرثيمر (1959) وكاتونا (1940)؛ والأعمال الرائدة لعلماء التطور مثل بياجيه (1926) وفygotsky (1978)؛ والأعمال الإبداعية لباحثي الذاكرة مثل بارلت (1932). في مجال علم النفس التربوي، يركز الاهتمام على التعليم من أجل التعلم المعنوي على الجذور النظرية التوليدية للتعلم من قبل رواد مثل ويتروك (1974، 1989) وأوزوبل (1968). بعض الأفكار الرئيسية التي تنبثق من هذا العمل هي التعلم المعنوي كاستيعاب للمخطط (أي ربط المعلومات الواردة بالمعرفة الموجودة)، والتعلم المعنوي كنشاط توليدي (أي الانتباه النشط للمواد ذات الصلة، وتنظيمها في هيكل متماسك، وربطها بالمعرفة السابقة ذات الصلة)، والتعلم المعنوي كإنشاء للمعرفة (أي بناء تمثيلات عقلية في الذاكرة العاملة). يمثل تطوير CTML محاولاتي لفهم وتوضيح هذه الأفكار المثيرة بناءً على الاختبار التجريبي.
كيف حصلت على هذه الرؤية؟ كطالب جامعي، كان هدفي هو قراءة كل كتاب كلاسيكي في علم النفس، ولكن في مرحلة الدراسات العليا، أصبح هدفي أكثر تركيزًا على قراءة كل كتاب كلاسيكي يتعلق بكيفية عمل التعلم، وخاصة الكتب التي يمكن أن تساعدني على فهم سؤالي الرئيسي حول كيفية التعليم من أجل النقل. وجدت مكتبات مستعملة مذهلة في آن آربر، حيث قضيت الكثير من وقت فراغي في البحث عن كنوز من الكتب مثل كتب بياجيه (1926)، بارتيليت (1932)، ويرثيمر (1959)، كاتونا (1940)، إيبينغهاوس (1913)، أوزوبل (1968)، والعديد من الآخرين. تأثرت بالاقتباس التمهيدي الذي وجدته على صفحة الغلاف لكتاب إيبينغهاوس من القرن التاسع عشر، “الذاكرة”: “من أقدم موضوع سنبني أحدث علم.” حتى كطالب دراسات عليا مبتدئ، شعرت بأنني محظوظ للمساهمة حتى بطريقة صغيرة في هذا العلم الأحدث حول كيفية عمل العقل البشري، والذي تبين في حالتي أنه علم التعلم والتعليم.

الرؤية 3: بناء النظرية ليس مسارًا مستقيمًا مخططًا له

لم تأخذ رحلتي للبحث عن نظرية التعلم المعنوي مسارًا مستقيمًا ومخططًا له، بل تقدمت بنمط غير منتظم من الخطوات الصغيرة استنادًا إلى اكتشافات عرضية على مدى عقود، مع مساهمات لا تقدر بثمن من قائمة طويلة من المتعاونين والزملاء. لم تكن نظرية CTML مبنية على مسار مهني منهجي خطوة بخطوة
خطة، وبالتأكيد لم تظهر في رأسي يومًا ما في حزمة مصقولة جميلة. بل خرجت على شكل نوبات متقطعة، مع سلسلة طويلة من المراجعات، والتنقيحات، والتوضيحات، والحذف، والإضافات.
من أين تأتي هذه الفكرة؟ لم أبدأ أبدًا بوجود خطة مهنية طويلة الأمد للبحث المنهجي في التعلم متعدد الوسائط، بل كانت لدي خطط أقصر تستهدف أسئلة بحث محددة لمدة عامين أو ثلاثة. على سبيل المثال، في الثمانينيات، بعد قراءة جميع كتابات ديفيد أوزوبل (مثل، أوزوبل، 1968)، أصبحت مهووسًا بالمنظمات المسبقة – المواد التي تُقدم قبل الدرس والتي تهدف إلى تحسين التعلم من خلال تنشيط المعرفة السابقة ذات الصلة. قادني هذا الخط من البحث إلى استنتاج غير متوقع بأن المنظمات المسبقة البصرية يمكن أن تكون فعالة في مساعدة المتعلمين على ربط مفهوم جديد بمعرفة سابقة مألوفة، مما جعلني أفكر في قوة ربط التمثيلات البصرية واللفظية كطريق للتعلم المعنوي. بينما كانت تلك الفكرة تتطور في ذهني طوال أواخر الثمانينيات والتسعينيات، أصبحت مهتمًا بكيفية دمج الرسوم التوضيحية في النص. قادني هذا الاستكشاف المصيري إلى صياغة ما أصبح مبدأ الوسائط المتعددة – الناس يتعلمون بشكل أفضل من الكلمات والصور مقارنة بالكلمات وحدها. باختصار، غالبًا ما لا أعرف إلى أين تتجه عملية بناء نظريتي، لكنني ببساطة أتبع المسارات المثمرة التي تأخذني إليها أبحاثي الحالية.

البصيرة 4: بناء النظرية هو مشكلة هندسية

استنادًا إلى هذه الرحلة، أدركت أن بناء النظرية في علم النفس التربوي يشبه كثيرًا حل مشكلة هندسية عملية. ومع ذلك، بدلاً من بناء جهاز أفضل بشكل متزايد لأداء وظيفة ما، فإن مهمتنا في بناء النظرية هي بناء تفسير أفضل بشكل تدريجي لظاهرة ذات صلة تعليمية (مثل كيفية تطوير الطلاب للتعلم المعنوي الذي ينتقل إلى مواقف جديدة). أستمر في العبث بالنظرية محاولًا جعلها تعمل بشكل أفضل استنادًا إلى أدلة بحثية جديدة ومنطق سليم. إحدى علامات العمل بشكل أفضل هي معدل الاقتباس الذي يتم به العمل من قبل الآخرين ودمجه في أطرهم، كما وثق كامب وآخرون (2022).
من أين تأتي هذه البصيرة؟ عندما أنظر إلى تطور CTML، وخاصة من خلال الطرق التي تمثلت بها بصريًا، أرى أنني بدأت بفكرة أساسية – هناك عدة شروط معرفية للتعلم المعنوي – ثم قمت باستمرار بتعديل الفكرة استنادًا إلى الأدلة البحثية التي أنتجتها والأفكار الجديدة التي صادفتها. عندما قرأت عمل بايفيو (1986) حول الترميز المزدوج، أدركت أهميته وحاولت دمج تلك الفكرة. عندما قرأت أعمال ميلر (1956) وبادلي (1986) وسويلر (1999) حول سعة الذاكرة العاملة المحدودة، أدركت أن هذه الفكرة الأساسية يجب أن تكون جزءًا من نظريتي. عندما قرأت عمل ويتروك حول التعلم التوليدي، أكد تفكيري بأن المعالجة المعرفية المناسبة أثناء التعلم كانت مفتاحًا للتعلم المعنوي وقادني إلى دمج نموذج SOI (استنادًا إلى الاختيار والتنظيم والتكامل). كما هو الحال في الهندسة، كانت طريقتي هي الاستمرار في إعادة تصميم ما لدي لجعله أفضل – وهو ما يعني في حالتي جعله أفضل في تفسير مجموعة أوسع من النتائج. بهذه الطريقة، بدأت عملي بما قد يسميه كوهين (1962) تحولًا في النموذج –
تحول من وجهات نظر سلوكية إلى وجهات نظر معرفية حول كيفية عمل التعلم – ولكن بعد ذلك على مدى جميع هذه السنوات اللاحقة، كان يتضمن تحسينًا مستمرًا على فكرتي الأصلية.

البصيرة 5: بناء النظرية هو عملية تكرارية تتضمن التفاعل المستمر بين البحث والنظرية

كما هو موضح في الشكل 1، بما يتماشى مع غرين (2022)، أبدأ بنواة فكرة نظرية (أي، نظرية)، والتي تقودني إلى سؤال قابل للاختبار (أي، سؤال بحث) أختبره في سلسلة من التجارب (تصميم البحث)، مما يولد نمطًا من النتائج (أدلة البحث) التي تساعدني على تحسين حسابي النظري (نظرية). يمثل تطوير CTML العديد من الدورات حول الدائرة المعروضة في الشكل (في اتجاه عقارب الساعة وعكس اتجاه عقارب الساعة). تعتمد هذه الدورات على مناقشات قيمة مع الزملاء حول كيفية صياغة النسخة التالية من النظرية، وكيفية توليد أسئلة بحث مفيدة (ومتى نعرف متى نتخلى عن الأسئلة غير المثمرة)، وكيفية تصميم دراسات مؤثرة، وكيفية تفسير النتائج. والنتيجة هي سلسلة من التكرارات لنظرية كيفية عمل التعلم المعنوي، كما هو موضح في الأقسام التالية.
من أين حصلت على هذه البصيرة؟ دعني أعطي مثالًا. ركزت معظم الأعمال المبكرة التي قام بها زملائي وأنا حول مبادئ التصميم التعليمي للتعلم متعدد الوسائط على الهدف التعليمي المتمثل في تقليل المعالجة الزائدة – أي تقليل المعالجة المعرفية للمتعلمين التي لا تتجه نحو تعلم المحتوى بحيث يمكن للمتعلمين استخدام الموارد المعرفية لفهم المادة. أدى ذلك، على سبيل المثال، إلى مبدأ التماسك حيث يتعلم الناس بشكل أفضل عندما نزيل المواد البصرية واللفظية غير الضرورية من الدرس. ومع ذلك، بالنسبة لبعض الدروس، حتى عندما أزلنا المواد غير الضرورية، لا يزال الطلاب يواجهون صعوبة في تعلمها، ربما لأنهم لم يرغبوا في بذل جهد لفهم
الشكل 1 دورة النظرية-البحث
المادة. أدى ذلك بنا إلى تطوير نوع جديد من أهداف التصميم التعليمي، والذي أطلق عليه اسم تعزيز المعالجة التوليدية – تحفيز المتعلم على الانخراط بنشاط مع المادة. اقترح هذا الهدف مجموعة جديدة تمامًا من تقنيات التعلم متعدد الوسائط استنادًا إلى المحفزات للانخراط في أنشطة التعلم التوليدية أثناء التعلم، مثل كتابة ملخص، ورسم توضيحي، وإنشاء منظم رسومي، وشرح للآخرين. بهذه الطريقة، أدت أدلة البحث (أي، عدم القدرة على تحسين التعلم من خلال تقليل المواد الزائدة) إلى فكرة نظرية جديدة (أي، تعزيز المعالجة التوليدية) والتي أدت إلى طرق بحث جديدة (أي، دمج أنشطة التعلم التوليدية).

البصيرة 6: بناء النظرية يعتمد على الاستمرارية في جمع أدلة البحث الجديدة

أيضًا بما يتماشى مع الشكل 1، يعتمد بناء النظرية المعرفية للتعلم متعدد الوسائط على التزام مستمر بالمقارنات التجريبية باستخدام تصميم ذو قيمة مضافة. في التجارب ذات القيمة المضافة، نقارن نتائج التعلم (وعندما يكون ذلك ممكنًا، عمليات التعلم) للأشخاص الذين يتعلمون من نسخة أساسية من درس متعدد الوسائط مع أولئك الذين يتعلمون من الدرس مع إضافة ميزة واحدة. على سبيل المثال، يمكننا مقارنة التعلم من الرسوم المتحركة المروية حول تكوين البرق مقابل التعلم من نفس الدرس مع عرض الكلمات كتعليقات مطبوعة في أسفل الشاشة. يعتمد تطوير النظرية على أساس قوي من أدلة البحث، والتي تتدفق من الاستعداد لتكرار التأثيرات المكتشفة في الدراسات ذات القيمة المضافة.
من أين جاءت هذه الرؤية؟ دعني أعطيك مثالاً. عندما كانت روكسانا مورينو طالبة دراسات عليا في مختبري، جاءت إلى مكتبي بفكرة غير معقولة (من وجهة نظري) وهي أن استخدام لغة محادثة في درس علمي عبر الإنترنت سيحسن نتائج التعلم مقارنةً بالدروس الحالية التي تستخدم لغة تقليدية ورسمية. على الرغم من تشكيكي، وضعنا خططًا لسلسلة من التجارب الدقيقة، وكل واحدة منها عادت بنتائج إيجابية قوية. بعد تكرار التأثير عدة مرات مع مواضيع محتوى متعددة، سمحت لنفسي أخيرًا بمشاركة مبدأ التخصيص مع المجتمع البحثي الأكبر، وهو فكرة أن الناس يتعلمون بشكل أفضل عندما يستخدم المعلمون لغة محادثة بدلاً من اللغة الرسمية. هذا فتح عيني على فكرة أن التعلم عبر الإنترنت يعتمد ليس فقط على المعالجة المعرفية، ولكن أيضًا على المعالجة الاجتماعية والعاطفية، مما أدى إلى عدة اتجاهات جديدة مستمرة لأبحاثنا (هوروفيتز وماير، 2021؛ لوسون وماير، 2022؛ لوسون وآخرون، 2021).

الرؤية 7: بناء النظرية هو نشاط جماعي

لم يكن ليحدث CTML لو كنت مكلفًا بالعمل بمفردي. لقد كان لي شرف العمل مع العشرات من المتعاونين على مر السنين الذين ساعدوا في بناء CTML. تستفيد النظرية من التعاون مع الطلاب وزملاء الحرم الجامعي وزملاء علماء النفس التعليمي من القريب والبعيد، بما في ذلك الزوار من جميع أنحاء العالم الذين ساهموا في مختبرنا على مر السنين. لقد تشكلت النظرية من خلال التقدم والتعليقات من المجتمع الأكاديمي الأكبر،
الذي يمثل فيه العديد من الأشخاص في الإصدارات المختلفة من دليل كامبريدج للتعلم متعدد الوسائط (ماير، 2005، 2014؛ ماير وفيوريلا، 2022). كما استفاد CTML من الأفكار من النظريات المتنافسة مثل نظرية الحمل المعرفي (باس وسويلر، 2022؛ سويلر، 1999، قيد النشر؛ سويلر وآخرون، 2011) أو النموذج المتكامل لفهم النص والصورة (شنتز، 2022، 2023). جزء من بناء النظرية هو القدرة على إقناع أقرانك وأن تكون مقتنعًا بهم.
من أين جاءت هذه الرؤية؟ بينما أنظر إلى مئات الأوراق البحثية حول الوسائط المتعددة التي تحمل اسمي، أرى أن الغالبية العظمى كانت مشتركة مع طلاب دراسات عليا أو زوار لمختبري. أسعى للاجتماع أسبوعيًا مع فريق البحث في مختبرنا – طلاب دراسات عليا، باحثين بعد الدكتوراه، وزوار. كما ألتقي بانتظام مع الطلاب والزوار والزملاء وأي شخص آخر يمكنني العثور عليه مهتم بالتحدث عن تحسين التعليم متعدد الوسائط. أعتز بهذه الاجتماعات لأنها أساسية في إعطائي فرصة للعمل على أفكار جديدة حول التعلم متعدد الوسائط.

ماضي النظرية المعرفية للتعلم متعدد الوسائط

لم أخطط لقضاء جزء كبير من مسيرتي الأكاديمية في تطوير النظرية المعرفية للتعلم متعدد الوسائط. في هذا القسم، أصف بإيجاز كيف حدث ذلك، بما في ذلك كيف صادفت اسمًا مناسبًا وتمثيلًا بصريًا موجزًا، وكيف بحثت عن إطار مفاهيمي، وكيف نمت CTML من حيث قاعدة البحث ومبادئ التصميم.

الصدام باسم النظرية

تحدٍ مهم في تطوير النظرية هو العثور على اسم يبرز المفاهيم الرئيسية في النظرية. تلخص الجدول 1 الأسماء التي أدت إلى النظرية المعرفية للتعلم متعدد الوسائط، والتي أبرزت مجموعة متطورة من المفاهيم المترابطة. بدأت بـ “نموذج التعلم المعنوي” (ماير، 1989)، الذي ركز على الظروف الخارجية للتعليم من أجل التعلم المعنوي، وهي: وجود مواد محتملة المعنى، وجود متعلمين يحتاجون إلى المساعدة، وجود توضيحات تقدم المساعدة، ووجود اختبار يمكنه اكتشاف نتائج التعلم المعنوي. غيرت الاسم إلى “نموذج الظروف للتوضيحات الفعالة” في ماير وغاليني (1990) لكنني احتفظت بنفس مجموعة الظروف على الرغم من ترتيبها المختلف.
كيف تقدمت إلى المستويات التالية؟ من خلال مناقشة حسابنا النظري باستمرار مع الطلاب والزملاء، أصبح واضحًا أن هذا النموذج الأولي يلتقط العوامل الخارجية المعنية في التعلم المعنوي ولكنه لم يتناول بشكل كافٍ العمليات المعرفية الداخلية المعنية. إذا كنت أرغب في معرفة كيف يعمل التعلم المعنوي، فسيتعين عليّ النظر في العمليات المعرفية أثناء التعلم. تأثرت بشدة بثلاثة خيوط من المنح الدراسية التي كنت أقرأ عنها – الترميز المزدوج كما صاغه بايفيو (1986)، سعة الذاكرة العاملة المحدودة كما صاغها ميلر (1956) وبادلي (1986) وسويلر (1999)، والمعالجة المعرفية النشطة أثناء التعلم كما صاغها ويتروك (1974، 1989). أولاً، ركزت على الترميز المزدوج.
الجدول 1 تغييرات الأسماء التي أدت إلى النظرية المعرفية للتعلم متعدد الوسائط وما بعدها
الاسم التركيز المصدر (المصادر) الأولية
نموذج التعلم المعنوي الظروف للتعليم من أجل التعلم المعنوي ماير (1989)
نموذج الظروف للتوضيحات الفعالة الظروف للتعليم من أجل التعلم المعنوي ماير وغاليني (1990)
نموذج الترميز المزدوج الترميز المزدوج ماير وأندرسون
نموذج المعالجة المزدوجة للتعلم متعدد الوسائط أو نموذج المعالجة المزدوجة للذاكرة العاملة الترميز المزدوج ماير ومورينو (1998);
نموذج SOI العمليات التوليدية ماير (1996)
نظرية التوليد العمليات التوليدية ماير وآخرون (1995)
نظرية التوليد للتعلم متعدد الوسائط العمليات التوليدية ماير (1997)؛ بلاس وآخرون (1998)
نظرية التعلم التوليدية العمليات التوليدية فيوريلا وماير (2015، 2016);
نظرية التوليد للتعلم العمليات التوليدية ماير (2010)
النظرية المعرفية للتعلم متعدد الوسائط العمليات التوليدية ماير (1997)؛ ماير وآخرون، (1996، 1999)؛ مورينو وماير (2000)؛ ماير (2001)؛ ماير وآخرون (2001)؛ ماير ومورينو، 2003)
نتيجة لعدم رضاي عن التركيز فقط على الظروف الخارجية للتعلم المعنوي، انتقلت الأسماء للتركيز على الظروف الداخلية للتعلم المعنوي من خلال النظر في المعالجة المعرفية في نظام معالجة المعلومات للمتعلمين. أكدت أسماء مختلفة جوانب مختلفة من المعالجة المعرفية مثل وجود قنوات مزدوجة للمواد اللفظية والبصرية، وجود سعة محدودة للمعالجة المعرفية، والانخراط في المعالجة التوليدية أثناء التعلم. أولاً، أكدت على مفهوم الترميز المزدوج (أي، قنوات معالجة معلومات منفصلة للمواد السمعية والبصرية) بأسماء مثل “نموذج الترميز المزدوج” (ماير وأندرسون، 1991، 1992) و”نموذج المعالجة المزدوجة للتعلم متعدد الوسائط” أو “نظرية المعالجة المزدوجة للذاكرة العاملة” (ماير ومورينو، 1998). كانت فكرة القنوات المنفصلة لمعالجة المواد البصرية واللفظية ستصبح سمة مركزية من CTML، كما هو موضح في الصفين في النموذج الحالي.
ثم، تم توسيع الاسم للتفريق بين ثلاث عمليات معرفية أثناء التعلم – اختيار المواد ذات الصلة لمزيد من المعالجة، تنظيمها في تمثيل معرفي متماسك، ودمجها مع المعرفة السابقة ذات الصلة. أشار ماير (1996) إلى هذه الفكرة باسم “نموذج SOI”، واستخدمت أوراق أخرى مصطلح “نظرية التوليد” (ماير، 1997؛ ماير وآخرون، 1995) أو “نظرية التوليد للتعلم متعدد الوسائط” (ماير، 1997؛ بلاس وآخرون، 1998) أو “نظرية التعلم التوليدية” (فيوريلا وماير، 2015، 2016) أو “نظرية التوليد للتعلم” (ماير، 2010). كان نموذج SOI اختراقًا مفاهيميًا كبيرًا بالنسبة لي، وقد ظل في جوهر CTML منذ ذلك الحين، كما هو موضح بالأسهم في النموذج الحالي. باختصار، يمثل نموذج SOI العمليات المعرفية الأساسية التي تدفع CTML.
أخيرًا، بدأنا في استخدام الاسم، “نظرية الإدراك في التعلم متعدد الوسائط” في ماير وآخرون، (1996، 1999)، ماير (1997)، ومورينو وماير (2000). كما قمنا بتفصيل الأفكار الأساسية لنظرية الإدراك في التعلم متعدد الوسائط في ماير ومورينو (2003) وجميع إصدارات التعلم متعدد الوسائط (ماير، 2001، 2009، 2021) وجميع إصدارات دليل كامبريدج للتعلم متعدد الوسائط (ماير، 2005، 2014؛ ماير وفيوريلا، 2022). شمل هذا النهج فكرة السعة المحدودة والتمييز بين المعالجة الزائدة، والأساسية، والإنشائية، حيث إن السعة الإدراكية الموجهة نحو المعالجة الزائدة تقلل من السعة المتاحة للمعالجة الأساسية والإنشائية.
كيف أحرزت تقدمًا يتجاوز النموذج الحالي لنموذج التعلم متعدد الوسائط (CTML)؟ بدأت الأدلة البحثية تتدفق التي نبهتني إلى فكرة أنه قد يكون هناك أكثر من مجرد معالجة معرفية في التعلم متعدد الوسائط. بدأنا نجد أدلة على دور العمليات الاجتماعية (مثل كيفية استخدام اللغة المحادثية لبناء العلاقات الاجتماعية) والمعالجة العاطفية (مثل كيفية تأثير إيماءات المعلم ونبرة صوته على التعلم)، وأدلة على دور العوامل التحفيزية (مثل فوائد التدريب على الكفاءة الذاتية في الدروس متعددة الوسائط) والعوامل الميتامعرفية (مثل دور الفروق الفردية في الوظيفة التنفيذية في التعلم من الدروس المشتتة). نحن الآن نتعامل مع كيفية تمثيل هذه الإضافات إلى نموذج التعلم متعدد الوسائط.
بينما نتحرك لتوسيع CTML، كما هو ملخص في الجدول 2، قمنا بتعزيز CTML بـ “نظرية الوكالة الاجتماعية” (أتكينسون وآخرون، 2005؛ ماير وآخرون، 2003)، التي تتضمن العمليات الاجتماعية أثناء التعلم، و”نظرية التعلم المعرفية-العاطفية مع الوسائط” (مورينو وماير، 2007) و”النموذج المعرفي-العاطفي للتعلم الإلكتروني” (لاوسون وماير، 2022؛ لاوسون وآخرون، 2021)، التي تتضمن العمليات العاطفية أثناء التعلم.
الجدول 2 النظريات المساعدة على النظرية المعرفية للتعلم متعدد الوسائط
اسم تأكيد المصدر (المصادر) الأولية
نظرية الوكالة الاجتماعية المعالجة الاجتماعية ماير وآخرون (2003)؛ أتكينسون وآخرون (2005)
النموذج المعرفي العاطفي للتعلم باستخدام الوسائط المعالجة العاطفية مورينو وماير (2007)
النموذج المعرفي العاطفي للتعلم الإلكتروني المعالجة العاطفية لاوسون وآخرون (2021)؛ لاوسون وماير (2022)
تعكس تغييرات الأسماء تحولًا من التركيز على الظروف الخارجية إلى العمليات الداخلية التي تتراوح بين معالجة الترميز المزدوج إلى المعالجة التوليدية إلى المعالجة الاجتماعية والعاطفية. على الرغم من أننا استغرقنا أكثر من عقد من الزمن للوصول إلى هناك، إلا أننا في القرن الحادي والعشرين استقرينا على “نظرية الإدراك في التعلم متعدد الوسائط” كاسم لنظريتنا.

التقدم نحو تمثيل بصري للنظرية

على الرغم من أنه استغرق العديد من المحاولات للعثور على اسم مناسب، إلا أننا واجهنا أيضًا صعوبة في إيجاد تمثيل بصري مناسب للنظرية. لقد وجدت أن التمثيلات البصرية تساعدني على فهم النظرية بشكل أفضل وتحسينها، لذا أبدأ عمومًا بتمثيل بصري ثم أعبر عن أفكاري بالكلمات. في حالة CTML، استغرق الأمر العديد من المحاولات لبناء مخطط انسيابي يمكن أن يمثل النظرية بشكل مختصر ودقيق. تظهر محاولاتنا الأولى في الشكلين 2 و3، اللذين يوضحان الظروف الخارجية للتعليم الفعال عبر الوسائط المتعددة – وجود نص ذي معنى، وجود رسومات توضيحية مكملة، وجود متعلمين يحتاجون إلى المساعدة، ووجود اختبار يقيس التعلم المعنوي (ماير، 1989؛ ماير وغاليني، 1990).
بعد ذلك، انتقلنا من مخطط انسيابي عمودي يوضح الظروف الخارجية للتعلم المعنوي إلى مخطط انسيابي عمودي يوضح خطوات في نموذج الترميز المزدوج (في الشكل 4؛ ماير وأندرسون، 1992). في مزيد من تحسين نموذج الترميز المزدوج، انتقلنا إلى مخطط انسيابي أفقي يتضمن قناة بصرية وقناة صوتية (في الشكل 5؛ ماير ومورينو، 1998). في نفس الوقت تقريبًا، طورنا مخطط انسيابي أكثر شمولاً يعتمد على نظرية توليدية وسعت العمليات المعرفية لتشمل الاختيار والتنظيم والتكامل، ولكن دون القنوات المزدوجة (في الشكل 6؛ ماير، 1996). يوضح الشكل 7 نسخة من المخطط الانسيابي للنظرية التوليدية (مع الاختيار والتنظيم والتكامل) التي تبدأ أيضًا في دمج القنوات المزدوجة التي تتضمن النصوص والرسوم التوضيحية (ماير، 1997؛ ماير وآخرون، 1995).
أخيرًا، في الشكل 8 (ماير، 2001؛ ماير وآخرون، 2001)، قمنا بتنقيح تلك المخططات السابقة لتشمل جميع ميزات النظرية الثلاث: القنوات المزدوجة كما هو موضح بواسطة صف سمعي في الأعلى وصف بصري في الأسفل؛ السعة المحدودة كما هو موضح بواسطة صناديق لذاكرة الحواس، وذاكرة العمل، وذاكرة طويلة الأمد؛ والمعالجة التوليدية كما هو موضح بواسطة الأسهم للاختيار، والتنظيم، والتكامل. لقد أصبحت هذه التمثيل الثابت للمخطط الذي استخدمناه لتصوير نظرية الإدراك في التعلم متعدد الوسائط طوال القرن الحادي والعشرين. إنها التمثيل الأكثر أهمية لنظرية CTML، وتساعدني باستمرار على التفكير في كيفية التعلم متعدد الوسائط.
الشكل 2 الظروف الخارجية للتعلم المعنوي (ماير، 1989)
الأعمال والآثار المترتبة على تصميم التعليم. عند التأمل، يبدو من المناسب أن تكون أهم عبارة في CTLM هي نفسها تمثيل وسائط متعددة يتكون من كلمات ورسوم بيانية.
تجاوزًا للمخطط الانسيابي القياسي لـ CTML في الشكل 8، أضفنا أيضًا بعض المخططات الانسيابية التكميلية لنظرية الوكالة الاجتماعية (ماير، 2009)، التي تضيف المعالجة الاجتماعية، وللنموذج المعرفي-العاطفي (لاوسون وماير، 2022؛ مورينو وماير، 2007)، الذي يضيف المعالجة العاطفية. التغييرات في
الشكل 3 نسخة بديلة من الظروف الخارجية للتعلم المعنوي (ماير وغاليني، 1990)
تُظهر مخطط التدفق التحسينات والإضافات في النظرية، بينما كنا نتعامل مع كيفية دمج مجموعة مترابطة من المفاهيم حول القنوات المزدوجة، والسعة المحدودة، والمعالجة النشطة.
الشكل 4 نموذج الترميز المزدوج (ماير وأندرسون، 1992)

إضافة إلى قاعدة البحث

على مدى أربعة عقود، نمت قاعدة الأبحاث لنظرية التعلم المتعدد الوسائط بشكل كبير، مما أتاح مزيدًا من تطوير النظرية. يوضح الجدول 3 عدد الاختبارات التجريبية التي أجراها زملائي وأنا، بالإضافة إلى عدد مبادئ تصميم الوسائط المتعددة التي اقترحناها بناءً على تلك الدراسات عبر الطبعات الثلاث من التعلم المتعدد الوسائط (ماير، 2001، 2009، 2021). بدءًا من دراساتنا الأولى في التعلم المتعدد الوسائط في عام 1989، تمكنا من توليد 15 مبدأً قائمًا على الأدلة استنادًا إلى أكثر من 200 تجربة أجراها زملائي وأنا.
توضح الجدول 4 المبادئ التي تم تضمينها في كل من الإصدارات الثلاثة من التعلم متعدد الوسائط. كما يتضح، بدأنا بشكل أساسي بالمبادئ التي تهدف إلى تقليل المعالجة الزائدة – المعالجة المعرفية التي لا تدعم الهدف التعليمي – مثل القضاء على المواد غير الضرورية (أي، مبدأ التماسك). ثم،
الشكل 5 نظرية المعالجة المزدوجة للذاكرة العاملة (ماير ومورينو، 1998)
الشكل 6 نموذج SOI (ماير، 1996)
الشكل 7 نظرية توليد تصميم الكتب المدرسية (ماير، 1997؛ ماير وآخرون، 1995)
الشكل 8 نظرية الإدراك في التعلم متعدد الوسائط (ماير، 2001؛ ماير وآخرون، 2001)
الجدول 3 نمو قاعدة البحث عبر ثلاث إصدارات من التعلم متعدد الوسائط
طبعة سنة
عدد التجارب
المقارنات
عدد
مبادئ
1 2001 ٤٥ ٧
2 2009 93 12
٣ ٢٠٢١ ٢٠١ 15
الجدول 4 نمو المبادئ عبر ثلاث إصدارات من التعلم متعدد الوسائط
مبدأ الطبعة الأولى (2001) الطبعة الثانية (2009) الطبعة الثالثة (2021)
وسائط متعددة إكس إكس إكس
التماسك إكس إكس إكس
الإشارة إكس إكس
الازدواجية إكس إكس إكس
التجاور المكاني إكس إكس إكس
التجاور الزمني إكس إكس إكس
تقسيم إكس إكس
التدريب المسبق إكس إكس
الأسلوب إكس إكس إكس
التخصيص إكس إكس
صوت إكس إكس
صورة إكس إكس
تجسيد إكس
الانغماس
نشاط توليدي إكس
لقد أضفنا مبادئ تهدف إلى إدارة المعالجة الأساسية – المعالجة المعرفية التي تهدف إلى تمثيل المادة في الذاكرة العاملة – مثل إيقاف فيديو مستمر لإنشاء مقاطع ذات وتيرة ذاتية (أي مبدأ التجزئة). وأخيرًا، أضفنا مبادئ تهدف إلى تعزيز المعالجة التوليدية – المعالجة المعرفية التي تهدف إلى فهم المادة – بشكل رئيسي مع التقنيات الجديدة مثل طلب من المتعلمين تلخيص أو شرح ما يتعلمونه (أي مبدأ النشاط التوليدي).
بالطبع، يتجاوز نمو قاعدة البحث التي تدعم CTML ما تنتجه مختبراتنا ويشمل شبكة متوسعة باستمرار من الباحثين حول العالم. كما هو ملخص في الجدول 5، يتم وصف بعض من هذا العمل في الطبعات الثلاثة من دليل كامبريدج للتعلم متعدد الوسائط (ماير، 2005، 2014؛ ماير وفيوريلا، 2022).
يدعم هذا النمو في قاعدة البحث تحسينات في تقييم نتائج التعلم – خاصة تطوير اختبارات النقل المناسبة. أنا مؤيد قوي للتكرار والبحث عن شروط الحدود التي تنطبق عليها مبادئ التصميم المختلفة. بشكل عام، يعتمد تطوير النظرية على مخزن من الأدلة البحثية التي تولدها المختبرات حول العالم.

الحالة الحالية لنظرية التعلم المعرفي متعدد الوسائط

تعتبر نظرية التعلم المعرفي متعدد الوسائط وصفًا قائمًا على الأدلة لكيفية تعلم الناس من الرسائل التعليمية متعددة الوسائط. الرسالة التعليمية متعددة الوسائط هي مادة تعليمية تتكون من كلمات (مثل النص المطبوع أو النص المنطوق) ورسوم بيانية (مثل الرسوم التوضيحية، الصور، الرسوم المتحركة، الفيديو، أو الواقع الافتراضي الغامر) تهدف إلى تعزيز المعرفة أو المهارات الجديدة لدى المتعلم. يمكن تقديم الرسالة التعليمية متعددة الوسائط في شكل مطبوع (مثل كتاب)، على شاشة الكمبيوتر (مثل فيديو تعليمي أو رسوم متحركة مسموعة أو لعبة محاكاة)، أو في الواقع الافتراضي عبر شاشة رأسية (مثل محاكاة تفاعلية). توفر النظرية تداعيات لتصميم رسائل تعليمية متعددة الوسائط فعالة، والتي يتم تقديمها كمبادئ تصميم.
تم تعزيز بعض التقدم في CTML من خلال التقدم في تكنولوجيا التعليم بما في ذلك الفيديو التعليمي، تكنولوجيا الرسوم المتحركة، التقنيات لإنشاء وكلاء على الشاشة، الواقع الافتراضي الغامر، والألعاب التعليمية، لكن لم يكن من نيتي دراسة تكنولوجيا التعليم بحد ذاتها. في الواقع، بدأت النظرية بدراسة التعلم من النصوص المطبوعة والرسوم التوضيحية المعروضة على الورق، وكان تركيزي دائمًا على كيفية تصميم تعليم فعال يتضمن الكلمات والرسوم البيانية. باختصار، تركيزي هو على كيفية مساعدة الناس على تعلم المحتوى الأكاديمي بدلاً من قدرات أحدث تقنيات التعليم.
في هذا القسم، ألخص الحالة الحالية لنظرية التعلم المعرفي متعدد الوسائط بما في ذلك الافتراضات التوجيهية، مخازن الذاكرة، العمليات المعرفية، المطالب على السعة المعرفية، وثلاثة أهداف تعليمية. كما ألخص 15 مبدأ تصميم تعليمي متعدد الوسائط قائم على الأدلة استنادًا إلى CTML. تتوفر أوصاف أكثر تفصيلًا في ماير. .
الجدول 5 نمو قاعدة البحث عبر ثلاث طبعات من دليل كامبريدج للتعلم متعدد الوسائط
الطبعة السنة الفصول المبادئ المؤلفون
1 2005 35 22 46
2 2014 34 25 52
3 2022 46 31 60
تم تمثيل نظرية التعلم المعرفي متعدد الوسائط في الشكل 8. تدخل الرسالة التعليمية متعددة الوسائط نظام المتعلم المعرفي من خلال عينيه وأذنه. تُحتفظ الكلمات المطبوعة والرسوم البيانية لفترة وجيزة في الذاكرة الحسية البصرية، وتُحتفظ الكلمات المنطوقة لفترة وجيزة في الذاكرة الحسية السمعية. مع تلاشي هذه الصور، يمكن للمتعلم الانتباه إلى بعض المواد، والتي تُنقل إلى الذاكرة العاملة لمزيد من المعالجة. في الذاكرة العاملة، يمكن للمتعلم تنظيم المادة التصويرية في نموذج تصويري والمادة اللفظية في نموذج لفظي ودمج التمثيلات التصويرية واللفظية المقابلة مع بعضها البعض ومع المعرفة ذات الصلة من الذاكرة طويلة المدى. النتيجة هي معرفة ذات معنى تُخزن في الذاكرة طويلة المدى ويمكن تطبيقها على مواقف جديدة.

الافتراضات التوجيهية لنظرية التعلم المعرفي متعدد الوسائط

تستند نظرية التعلم المعرفي متعدد الوسائط كما هو موضح في الشكل 8 إلى ثلاثة افتراضات توجيهية مستمدة من علم النفس المعرفي: القنوات المزدوجة، السعة المحدودة، والمعالجة النشطة. افتراض القنوات المزدوجة هو أن البشر لديهم قنوات منفصلة ولكنها تتفاعل لمعالجة المعلومات السمعية/اللفظية والمعلومات التصويرية/البصرية (مثل السرد والرسوم المتحركة، على التوالي). افتراض السعة المحدودة هو أن البشر يمكنهم معالجة عدد قليل فقط من قطع المعلومات في كل قناة في وقت واحد. افتراض المعالجة النشطة هو أن التعلم المعنوي يحدث عندما يشارك المتعلم في معالجة معرفية مناسبة أثناء التعلم، بما في ذلك اختيار المواد ذات الصلة للانتباه إليها في الدرس، وتنظيم المادة الواردة عقليًا في تمثيل متماسك في الذاكرة العاملة، وربطها عقليًا مع التمثيلات المقابلة ومع المعرفة السابقة ذات الصلة التي تم تنشيطها من الذاكرة طويلة المدى.

ثلاثة مخازن للذاكرة في نظرية التعلم المعرفي متعدد الوسائط

تحتوي CTML على ثلاثة مخازن للذاكرة، والتي تم تمثيلها كصناديق في الشكل 8: الذاكرة الحسية، الذاكرة العاملة، والذاكرة طويلة المدى. تحتفظ الذاكرة الحسية بصور بصرية كاملة (في الذاكرة الحسية البصرية) التي تدخل من خلال العيون وصور سمعية كاملة (في الذاكرة الحسية السمعية) التي تدخل من خلال الأذنين، لكن الصور تتلاشى بسرعة خلال جزء من الثانية. تحتفظ الذاكرة العاملة بقطع المعلومات التصويرية/البصرية والسمعية/اللفظية التي انتبه إليها المتعلم قبل أن تتلاشى من الذاكرة الحسية. يمكن إعادة ترتيب هذه المعلومات، لكن يمكن معالجة عدد قليل فقط من قطع المعلومات في كل قناة في أي وقت. الذاكرة طويلة المدى هي مخزن المعرفة الدائم للمتعلم، يمكن تنشيط أجزاء منها وإحضارها إلى الذاكرة العاملة أثناء التعلم.

خمسة عمليات معرفية في نظرية التعلم المعرفي متعدد الوسائط

تحتوي CTML على خمس عمليات معرفية، والتي تم تمثيلها كسهام في الشكل 8: اختيار الكلمات، اختيار الصور، تنظيم الكلمات، تنظيم الصور، و
dمج. يشير اختيار الكلمات إلى الانتباه إلى الأجزاء ذات الصلة من النص المطبوع، ويشير اختيار الصور إلى الانتباه إلى الأجزاء ذات الصلة من الرسوم البيانية المعروضة. يشير تنظيم الكلمات إلى ترتيب الكلمات ذات الصلة في نموذج لفظي في الذاكرة العاملة، ويشير تنظيم الصور إلى ترتيب الأجزاء ذات الصلة من الرسوم البيانية في نموذج تصويري في الذاكرة العاملة. يشير الدمج إلى إنشاء اتصالات بين التمثيلات اللفظية والتصويرية المقابلة في الذاكرة العاملة بالإضافة إلى المعرفة ذات الصلة من الذاكرة طويلة المدى. يعتمد التعلم المعنوي على انخراط المتعلم في معالجة معرفية مناسبة تتضمن الاختيار والتنظيم والدمج. يهدف تصميم التعليم إلى توجيه هذه العمليات.

ثلاثة مطالب على السعة المعرفية

مبدأ مركزي في نظرية التعلم المتعددة الوسائط المعرفية هو أن سعة الذاكرة العاملة محدودة، ولكن هناك ثلاثة مطالب على تلك السعة المعرفية المحدودة أثناء التعلم: المعالجة الزائدة، المعالجة الأساسية، والمعالجة التوليدية. المعالجة الزائدة هي معالجة معرفية لا تدعم الهدف التعليمي؛ تعتمد كمية المعالجة الزائدة على درجة ضعف التصميم التعليمي، مثل تقديم معلومات لفظية أو تصويرية زائدة في الدرس. المعالجة الأساسية هي معالجة معرفية لتمثيل المادة المقدمة عقليًا في الذاكرة العاملة؛ تعتمد كمية المعالجة الأساسية على التعقيد الفطري للمادة بالنسبة للمتعلم، مثل تقديم العديد من المفاهيم المترابطة في درس سريع. المعالجة التوليدية هي معالجة معرفية تهدف إلى فهم المعلومات الواردة؛ تعتمد كمية المعالجة التوليدية على مستوى دافع المتعلم لبذل جهد لفهم الدرس. تتطلب الأنواع الثلاثة من المعالجة كل منها بعضًا من سعة المتعلم المعرفية المحدودة، لذا فإن السعة المستخدمة في المعالجة الزائدة تأخذ من السعة التي يمكن استخدامها في المعالجة الأساسية والتوليدية، والسعة المعرفية المستخدمة في المعالجة الأساسية تأخذ من السعة التي يمكن استخدامها في المعالجة التوليدية.

ثلاثة أهداف تعليمية

تؤدي المطالب الثلاثة على السعة المعرفية إلى ثلاثة أهداف تعليمية: تقليل المعالجة الزائدة، إدارة المعالجة الأساسية، وتعزيز المعالجة التوليدية. اعتبر حالة يكون فيها درس مصمم بشكل سيء يتسبب في تخصيص المتعلم تقريبًا كل سعتهم المعرفية للمعالجة الزائدة، بحيث لا يتبقى لديهم سعة معرفية كافية للانخراط في المعالجة الأساسية والتوليدية اللازمة. في هذه الحالة، يكون هدف تعليمي مهم هو تقليل المعالجة الزائدة. يمكن تحقيق ذلك، على سبيل المثال، من خلال القضاء على الكلمات والعناصر الرسومية غير الضرورية من الدرس.
اعتبر حالة أخرى تم فيها تقليل المعالجة الزائدة، ولكن الدرس معقد لدرجة أن كمية المعالجة الأساسية المطلوبة تتجاوز سعة المتعلم المعرفية. في هذه الحالة، يكون هدف تعليمي مهم هو
إدارة المعالجة الأساسية. يمكن تحقيق ذلك، على سبيل المثال، من خلال تقسيم درس مستمر إلى أجزاء قابلة للإدارة يمكن أن يتم ضبطها من قبل المتعلم.
أخيرًا، دعنا نفترض أننا قللنا المعالجة الزائدة وأدرنا المعالجة الأساسية، لذا فإن السعة المعرفية متاحة للمعالجة التوليدية، ولكن المتعلم غير متحفز لبذل جهد لفهم المادة. في هذه الحالة، يكون هدف تعليمي مهم هو تعزيز المعالجة التوليدية. يمكن تحقيق ذلك، على سبيل المثال، من خلال تحفيز المتعلم للانخراط في نشاط تعلم توليدي مثل كتابة ملخص أو اختبار ذاتي خلال فترات توقف الدرس.

خمسة عشر مبدأ لتصميم التعليم المتعدد الوسائط

تلخص الجدول 6 خمسة عشر مبدأ مدعومًا بالبحث من قبل زملائي وأنا على مر السنين. تتناول المجموعة الأولى من خمسة مبادئ الهدف التعليمي المتمثل في تقليل المعالجة الزائدة؛ تتناول المجموعة الثانية من أربعة مبادئ الهدف التعليمي المتمثل في إدارة المعالجة الأساسية؛ وتتناول المجموعة الثالثة من ستة مبادئ الهدف التعليمي المتمثل في تعزيز المعالجة التوليدية. كل مبدأ يخضع لظروف حدودية تشمل لمن ينطبق المبدأ، ولأي نوع من الدروس ينطبق المبدأ، وتحت أي ظروف ينطبق المبدأ. يتم وصف هذه بمزيد من التفصيل في التعلم المتعدد الوسائط (ماير، 2021). يتم وصف العديد من المبادئ الأخرى في الأدبيات الأوسع، مثل في دليل كامبريدج للتعلم المتعدد الوسائط (ماير وفيوريلا، 2022).

مستقبل نظرية التعلم المتعدد الوسائط المعرفية

حتى عندما تصل نظرية إلى حالة مستقرة إلى حد ما، مثل نظرية التعلم المتعدد الوسائط المعرفية، لا يزال هناك مجال لمزيد من تطوير النظرية. تركز النسخة الحالية من CTML بشكل أساسي على المعالجة المعرفية أثناء التعلم – مثل الاختيار والتنظيم والتكامل – كآلية أساسية إلى جانب الافتراضات حول بنية نظام معالجة المعلومات البشرية، وسعة الذاكرة العاملة المحدودة والقنوات المزدوجة للمعالجة البصرية واللفظية. في هذا القسم، أستكشف الاتجاهات المستقبلية لـ CTML التي تتضمن دمج مكونات تعلم جديدة تتجاوز هذه العمليات المعرفية الأساسية، مثل العمليات الاجتماعية، والعمليات العاطفية، والعمليات الدافعة، والعمليات الميتامعرفية. في المستقبل، أتوقع أيضًا زيادة في قاعدة البحث، وزيادة في عدد مبادئ التصميم المستندة إلى الأدلة، وتحديد أوضح لظروف الحدود لمبادئ التصميم.

دمج مكونات جديدة في نظرية التعلم المتعدد الوسائط المعرفية

يتم إحراز تقدم في دمج المكونات التي لم يتم دراستها بشكل كافٍ في نظرية التعلم المتعدد الوسائط المعرفية، بما في ذلك العمليات الاجتماعية، والعاطفية، والدافعة، والميتامعرفية. فيما يتعلق بالعمليات الاجتماعية، ينعكس التقدم الأولي في دمج نظرية الوكالة الاجتماعية (أتكينسون وآخرون، 2005؛ ماير وآخرون، 2003)، التي تفترض أن المتعلمين يبذلون جهدًا أكبر لفهم الدرس عندما يشعرون أن
الجدول 6 خمسة عشر مبدأ لتصميم التعليم المتعدد الوسائط (من ماير، 2021)
مبدأ لتقليل المعالجة الزائدة حجم التأثير اختبارات
1. مبدأ التماسك: يتعلم الناس بشكل أفضل عندما يتم استبعاد المواد الزائدة بدلاً من تضمينها 0.86 19
2. مبدأ الإشارة: يتعلم الناس بشكل أفضل عندما تتم إضافة إشارات تبرز تنظيم المادة الأساسية 0.69 16
3. مبدأ التكرار: لا يتعلم الناس بشكل أفضل عندما يتم إضافة نص مطبوع إلى الرسوم البيانية والسرد؛ يتعلم الناس بشكل أفضل من الرسوم البيانية والسرد مقارنة بالرسوم البيانية والسرد والنص المطبوع، عندما يكون الدرس سريعًا 0.10 12
4. مبدأ القرب المكاني: يتعلم الناس بشكل أفضل عندما يتم تقديم الكلمات والصور المتطابقة بالقرب من بعضها البعض بدلاً من بعيدًا عن بعضها على الصفحة أو الشاشة 0.82 9
5. مبدأ القرب الزمني: يتعلم الناس بشكل أفضل عندما يتم تقديم الكلمات والصور المتطابقة في وقت واحد بدلاً من بالتتابع 1.31 8
مبادئ إدارة المعالجة الأساسية حجم التأثير اختبارات
6. مبدأ التقسيم: يتعلم الناس بشكل أفضل عندما يتم تقديم درس متعدد الوسائط في أجزاء يمكن للمتعلم ضبطها بدلاً من وحدة مستمرة 0.67 7
7. مبدأ التدريب المسبق: يتعلم الناس بشكل أفضل من درس متعدد الوسائط عندما يعرفون أسماء وخصائص المفاهيم الرئيسية 0.78 10
8. مبدأ الوسائط: يتعلم الناس بشكل أفضل من الرسوم البيانية والسرد مقارنة بالرسوم البيانية والنص على الشاشة 1.00 19
مبادئ إدارة المعالجة الأساسية حجم التأثير اختبارات
9. مبدأ الوسائط المتعددة: يتعلم الناس بشكل أفضل من الكلمات والصور مقارنة بالكلمات وحدها 1.35 13
10. مبدأ التخصيص: يتعلم الناس بشكل أفضل من دروس متعددة الوسائط عندما تكون الكلمات بأسلوب محادثة بدلاً من أسلوب رسمي 1.00 15
11. مبدأ الصوت: يتعلم الناس بشكل أفضل عندما يتم سرد الدروس متعددة الوسائط بصوت إنساني ودود بدلاً من صوت آلة 0.74 7
12. مبدأ الصورة: لا يتعلم الناس بالضرورة بشكل أفضل من درس متعدد الوسائط عندما تتم إضافة صورة المتحدث إلى الشاشة 0.20 7
13. مبدأ التجسيد: يتعلم الناس بشكل أعمق من العروض التقديمية متعددة الوسائط عندما يظهر المعلم على الشاشة تجسيدًا عاليًا بدلاً من تجسيد منخفض 0.58 17
14. مبدأ الانغماس: لا يتعلم الناس بالضرورة بشكل أفضل في الواقع الافتراضي الغامر ثلاثي الأبعاد مقارنة بعرض ثنائي الأبعاد المقابل على سطح المكتب -0.10 9
15. مبدأ النشاط التوليدي: يتعلم الناس بشكل أفضل عندما يتم توجيههم في تنفيذ أنشطة التعلم التوليدية أثناء التعلم 0.71 44
المعلم يعمل معهم. فيما يتعلق بالعمليات العاطفية، يُعكس التقدم الأولي في دمج نموذج التعلم المعرفي-العاطفي مع الوسائط (مورينو وماير، 2007) ونموذج التعلم الإلكتروني المعرفي-العاطفي (لاوسون وآخرون، 2021؛ لاوسون وماير، 2022)، الذي يفترض أن المتعلمين يبذلون جهدًا أكبر لفهم الدرس عندما يشعرون بمشاعر إيجابية أثناء التعلم. فيما يتعلق بالعمليات التحفيزية، يُعكس التقدم الأولي في الأبحاث التي تظهر أن الطلاب يتعلمون بشكل أفضل من درس الإحصاء عندما يتم إعطاؤهم تلميحات تهدف إلى تعزيز كفاءتهم الذاتية وتقليل القلق أثناء التعلم (هوانغ وماير، 2019؛ هوانغ وآخرون، 2020). فيما يتعلق بالعمليات الميتامعرفية، يُعكس التقدم الأولي في الأبحاث التي تقيم أحكام المتعلمين حول الفهم أثناء فترات التوقف في درس العلوم متعدد الوسائط (بيليغارد وماير، 2015أ، 2015ب).
بشكل عام، هناك حاجة إلى مزيد من العمل لدمج مكونات جديدة في النظرية المعرفية للتعلم متعدد الوسائط، خاصة بالنظر إلى التقدم المستمر في نظريات التعلم الذاتي التنظيم والتحفيز. على سبيل المثال، أظهر كولمان وآخرون (2023) كيف يمكن توسيع عمليات SOI في CTML من خلال منظور نظرية التحفيز. من الواضح أن التنظيم الذاتي يلعب دورًا مهمًا في فهم كيفية تعلم الطلاب من المواد متعددة الوسائط وفي فهم كيفية تصميم مواد تعليمية متعددة الوسائط للطلاب ذوي أنواع مختلفة من مهارات التنظيم الذاتي.

توسيع منهجيات البحث لمراقبة عمليات التعلم

من أجل دمج مكونات جديدة في CTML، نحتاج إلى توسيع منهجيات البحث المستخدمة لمراقبة عمليات التعلم، بما في ذلك استخدام تتبع العين، والبيومترية، ومراقبة الدماغ، وتقنيات الاستطلاع. فيما يتعلق بتقنيات تتبع العين، يتم إحراز تقدم في تحديد كيفية تخصيص المتعلمين انتباههم عند مشاهدة درس متعدد الوسائط، مثل عدد المرات التي تتحرك فيها أعينهم بين الكلمات المطبوعة والعناصر الرسومية المقابلة (جونستون وماير، 2012؛ بونس وآخرون، 2018) أو أين ينظر الطلاب عند مشاهدة محاضرة فيديو تتكون من معلم يقف بجوار شرائح معروضة (ستول وماير، 2021؛ ستول وآخرون، 2018). فيما يتعلق بالتقنيات البيومترية، يُعكس التقدم الأولي في الدراسات التي تفحص الإثارة العاطفية للطلاب كما تقاس بتقلب معدل ضربات القلب والنشاط الكهربائي للجلد عند التعلم في واقع افتراضي غامر مقابل الوسائط التقليدية (بارونغ وماير، 2021أ، 2021ب). فيما يتعلق بتقنيات مراقبة الدماغ، يُعكس التقدم الأولي في الدراسات التي تفحص مستوى تشتيت انتباه الطلاب كما تقاس بواسطة نظام تخطيط الدماغ الكهربائي (EEG) المحمول عند التعلم في واقع افتراضي غامر مقابل الوسائط التقليدية (بارونغ وماير، 2021أ، 2021ب). وبالمثل، تقدم تقنية قياس الطيف القريب من الأشعة تحت الحمراء (fNIRS) طريقًا محتملاً لاكتشاف شدة النشاط في مناطق الدماغ المتعلقة بالمعالجة المعرفية والاجتماعية والعاطفية (لي وآخرون، 2022). الطريقة التقليدية لقياس أنشطة التعلم هي من خلال استطلاعات الرأي الذاتية التي تُجرى بعد التعلم، لكن يتم إحراز تقدم أولي في إدخال عناصر استطلاع قصيرة خلال فترات التوقف داخل درس مستمر (بيليغارد وماير، 2015أ، 2015ب). بشكل عام، أتوقع تقدمًا في المنهجيات التي تهدف إلى اكتشاف عمليات التعلم خلال حلقة تعليمية، والتي ستكمل التقنيات الحالية لقياس نتائج التعلم.

توسيع قاعدة المعرفة

أخيرًا، أتوقع أن يتم تعزيز النظرية المعرفية للتعلم متعدد الوسائط بزيادة في قاعدة البحث، مما سيمكن من زيادة وتنقيح مبادئ التصميم وتحديد أوضح لظروف الحدود عندما يكون من المرجح أن تنطبق مبدأ. مع نمو قاعدة البحث، أتوقع رؤية المزيد من التحليلات الميتا التي تحدد قوة مبادئ التصميم الرئيسية متعددة الوسائط بالإضافة إلى عواملها المعدلة. اتجاه مهم للبحث المستقبلي هو إجراء دراسات في بيئات التعلم الأكثر طبيعية مثل الفصول الدراسية المدرسية، والدورات عبر الإنترنت، والتدريب المهني. الاختبار النهائي لقيمة النظرية المعرفية للتعلم متعدد الوسائط يعتمد على دورها العملي في تحسين التعليم والتدريب كما يتضح في خمس إصدارات من التعلم الإلكتروني وعلم التعليم (كلارك وماير، 2003، 2008، 2011، 2016، 2024).

الخاتمة

تمثل النظرية المعرفية للتعلم متعدد الوسائط واحدة من قصص نجاح علم النفس التعليمي من خلال إظهار التقدم في معالجة بعض الأسئلة الأساسية في تخصصنا حول التعلم والتعليم: كيف يتعلم الناس وكيف يمكننا مساعدتهم على التعلم؟ على وجه الخصوص، تمثل CTML محاولاتنا لفهم كيفية عمل التعلم المعنوي للمواد الأكاديمية وكيفية تحسين تصميم المواد الأكاديمية لتعزيز التعلم المعنوي. لأكثر من 100 عام، تعامل مجالنا مع هذه الأسئلة. يوفر تطوير النظرية المعرفية للتعلم متعدد الوسائط مثالًا على كيفية مساهمة علم النفس التعليمي في النظرية النفسية والممارسة التعليمية. سأعتبر هذه المقالة نجاحًا، إذا شجعتك على الانضمام إلى هذا الجهد الجدير، مثل إجراء دراسات قائمة على النظرية حول التعلم الأكاديمي المعنوي، أو المساهمة في نظريات التعلم الأكاديمي المعنوي المستندة إلى البحث، أو تطوير تعليم قائم على الأدلة.
تم دعم إعداد هذه الورقة من خلال منحة N00014-21-1-2047 من مكتب الأبحاث البحرية.
هذا المقال مرخص بموجب رخصة المشاع الإبداعي للاستخدام والمشاركة والتكيف والتوزيع وإعادة الإنتاج في أي وسيلة أو صيغة، طالما أنك تعطي الائتمان المناسب للمؤلفين الأصليين والمصدر، وتوفر رابطًا لرخصة المشاع الإبداعي، وتوضح ما إذا كانت هناك تغييرات قد تم إجراؤها. الصور أو المواد الأخرى من طرف ثالث في هذا المقال مشمولة في رخصة المشاع الإبداعي للمقال، ما لم يُشار إلى خلاف ذلك في سطر ائتمان للمادة. إذا لم تكن المادة مشمولة في رخصة المشاع الإبداعي للمقال واستخدامك المقصود غير مسموح به بموجب اللوائح القانونية أو يتجاوز الاستخدام المسموح به، فستحتاج إلى الحصول على إذن مباشرة من صاحب حقوق الطبع والنشر. لعرض نسخة من هذه الرخصة، قم بزيارةhttp://creativecommons.org/licenses/by/4.0/.

References

Atkinson, R. K., Mayer, R. E., & Merrill, M. M. (2005). Fostering social agency in multimedia learning: Examining the impact of an animated agent’s voice. Contemporary Educational Psychology, 30(1), 117-139.
Ausubel, D. P. (1968). Educational psychology: A cognitive view. Holt, Rinehart, & Winston.
Baddeley, A. (1986). Working memory. Oxford University Press.
Bartlett, F. C. (1932). Remembering. Cambridge University Press.
Camp, G., Surma, T., & Kirschner, P. A. (2022). Foundations of multimedia learning. In R. E. Mayer & L. Fiorella (Eds.), The Cambridge handbook of multimedia learning (3rd ed., pp. 17-24). Cambridge University Press.
Clark, R. C., & Mayer, R. E. (2003). e-Learning and the science of instruction. Jossey-Bass.
Clark, R. C., & Mayer, R. E. (2008). e-Learning and the science of instruction (2nd ed.). Jossey-Bass.
Clark, R. C., & Mayer, R. E. (2011). e-Learning and the science of instruction (3rd ed.). Pfeiffer.
Clark, R. C., & Mayer, R. E. (2016). e-Learning and the science of instruction (4th ed.). Wiley.
Clark, R. C., & Mayer, R. E. (2024). e-Learning and the science of instruction (5th ed.). Wiley.
Ebbinghaus, H. (1913 [1885]). Memory: A contribution to experimental psychology. Teachers College Columbia University.
Fiorella, L., & Mayer, R. E. (2015). Learning as a generative activity: Eight learning strategies that promote understanding. Cambridge University Press.
Fiorella, L., & Mayer, R. E. (2016). Eight ways to promote generative learning. Educational Psychology Review, 28(4), 717-741.
Greene, J. A. (2022). What can educational psychology learn from, and contribute to, theory development scholarship. Educational Psychology Review, 34, 3011-3035.
Horovitz, T., & Mayer, R. E. (2021). Learning with human and virtual instructors who display happy or bored emotions in video lectures. Computers in Human Behavior, 119, 106724.
Huang, X., & Mayer, R. E. (2019). Adding self-efficacy features to an online statistics lesson. Journal of Educational Computing Research, 57, 1003-1037.
Huang, X., Mayer, R. E., & Esher, E. (2020). Better together: Effects of four self-efficacy building strategies on online statistical learning. Contemporary Educational Psychology, 63, 101924.
Johnson, C., & Mayer, R. E. (2012). An eye movement analysis of the spatial contiguity effect in multimedia learning. Journal of Experimental Psychology: Applied, 18, 178-191.
Katona, G. (1940). Organizing and memorizing. Columbia University Press.
Kuhlmann, S. L., Bernacki, M. L., Greene, J. A., Hogan, K. A., Evans, M., Plumley, R., …, & Panter, A. (2023). How do students’ achievement goals relate to learning from well-designed instructional videos and subsequent exam performance?. Contemporary Educational Psychology, 73, 102162.
Kuhn, T. (1962). The structure of scientific revolutions. University of Chicago Press.
Lawson, A., & Mayer, R. E. (2022). Does the emotional stance of human and virtual instructors in instructional videos affect learning processes and outcomes? Contemporary Educational Psychology, 70, 102080.
Lawson, A. P., Mayer, R. E., Adamo-Villani, N., Benes, B., Lei, X., & Cheng, J. (2021). The positivity principle: Do positive instructors improve learning from video lectures? Educational Technology Research and Development, 69(6), 3101-3129.
Li, W., Wang, F., Mayer, R. E., & Liu, T. (2022). Animated pedagogical agents enhance learning outcomes and brain activity during learning. Journal of Computer Assisted Learning, 38, 621-637.
Mayer, R. E. (1989). Systematic thinking fostered by illustrations in scientific text. Journal of Educational Psychology, 81, 240-246.
Mayer, R. E. (1996). Learning strategies for making sense out of expository text: The SOI model for guiding three cognitive processes in knowledge construction. Educational Psychology Review, 8(4), 357-371.
Mayer, R. E. (1997). Multimedia learning: Are we asking the right questions? Educational Psychologist, 32, 1-19.
Mayer, R. E. (2001). Multimedia learning. Cambridge University Press.
Mayer, R. E. (Ed.). (2005). The Cambridge handbook of multimedia learning. Cambridge University Press.
Mayer, R. E. (2009). Multimedia learning (2nd ed.). Cambridge University Press.
Mayer, R. E. (2010). Merlin C. Wittrock’s enduring contributions to the science of learning. Educational Psychologist, 45, 46-50.
Mayer, R. E. (Ed.). (2014). The Cambridge handbook of multimedia learning (2nd ed.). Cambridge University Press.
Mayer, R. E. (2021). Multimedia learning (3rd ed.). Cambridge University Press.
Mayer, R. E. (2022). Cognitive theory of multimedia learning. In R. E. Mayer & L. Fiorella (Eds.), The Cambridge handbook of multimedia learning (3rd ed., pp. 57-72). Cambridge University Press.
Mayer, R. E., & Fiorella, L. (Eds.). (2022). The Cambridge handbook of multimedia learning (3rd ed.). Cambridge University Press.
Mayer, R. E., & Anderson, A. B. (1991). Animations need narrations: An experimental test of a dualcoding hypothesis. Journal of Educational Psychology, 83, 484-490.
Mayer, R. E., & Anderson, A. B. (1992). The instructive animation: Helping students build connections between words and pictures in multimedia learning. Journal of Educational Psychology, 84, 444-452.
Mayer, R. E., & Gallini, J. (1990). When is an illustration worth ten thousand words? Journal of Educational Psychology, 82, 715-727.
Mayer, R. E., & Moreno, R. (1998). A split-attention effect in multimedia learning. Journal of Educational Psychology, 90, 312-320.
Mayer, R. E., & Moreno, R. (2003). Nine ways to reduce cognitive load in multimedia learning. Educational Psychologist, 38, 43-52.
Mayer, R. E., Steinhoff, K., Bower, G., & Mars, R. (1995). A generative theory of textbook design: Using annotated illustrations to foster meaningful learning of science text. Educational Technology Research and Development, 43, 31-43.
Mayer, R. E., Bove, W., Bryman, A., Mars, R., & Tapangco, L. (1996). When less is more: Meaningful learning from visual and verbal summaries. Journal of Educational Psychology, 88, 64-73.
Mayer, R. E., Moreno, R., Boire, M., & Vagge, S. (1999). Maximizing constructivist learning from multimedia communications by minimizing cognitive load. Journal of Educational Psychology, 91, 638-643.
Mayer, R. E., Heiser, J., & Lonn, S. (2001). Cognitive constraints on multimedia learning: When presenting more material results in less understanding. Journal of Educational Psychology, 93, 187-198.
Mayer, R. E., Sobko, K., & Mautone, P. D. (2003). Social cues in multimedia learning: Role of speaker’s voice. Journal of Educational Psychology, 95(2), 419-425.
Miller, G. A. (1956). The magical number seven, plus or minus two: Some limits on our capacity for processing information. Psychological Review, 63(2), 81-97.
Moreno, R., & Mayer, R. E. (2000). A coherence effect in multimedia learning: The case for minimizing irrelevant sounds in the design of multimedia instructional messages. Journal of Educational Psychology, 92, 117-125.
Moreno, R., & Mayer, R. (2007). Interactive multimodal learning environments: Special issue on interactive learning environments: Contemporary issues and trends. Educational Psychology Review, 19(3), 309-326.
Paas, F., & Sweller, J. (2022). Implications of cognitive load theory for multimedia learning. In R. E. Mayer & L. Fiorella (Eds.), The Cambridge handbook of multimedia learning (3rd ed., pp. 73-81). Cambridge University Press.
Paivio, A. (1986). Mental representations: A dual-coding approach. Oxford University Press.
Parong, J., & Mayer, R. E. (2021a). Cognitive and affective processes for learning science in immersive virtual reality. Journal of Computer Assisted Learning, 37, 226-241.
Parong, J., & Mayer, R. E. (2021b). Learning about history in immersive virtual reality: Does immersion facilitate learning? Educational Technology Research and Development, 69, 1433-1451.
Piaget, J. (1926). The language and thought of the child. Kegan, Paul, Trench, Trubner and Company.
Pilegard, C., & Mayer, R. E. (2015a). Within-subject and between-subject conceptions of metacomprehension accuracy. Learning and Individual Differences, 41, 54-61.
Pilegard, C., & Mayer, R. E. (2015b). Adding judgments of understanding to the metacognitive toolbox. Learning and Individual Differences, 41, 62-72.
Plass, J. L., Chun, D. M., Mayer, R. E., & Leutner, D. (1998). Supporting visual and verbal learning preferences in a second language multimedia learning environment. Journal of Educational Psychology, 90, 25-36.
Ponce, H. R., Mayer, R. E., Loyola, M. S., Lopez, M., & Mendez, E. E. (2018). When two computersupported learning strategies are better than one: An eye-tracking study. Computers & Education, 125, 376-388.
Schnotz, W. (2022). Integrated model of text and picture comprehension. In R. E. Mayer & L. Fiorella (Eds.), The Cambridge handbook of multimedia learning (3rd ed., pp. 82-99). Cambridge University Press.
Schnotz, W. (2023). Multimedia comprehension. Cambridge University Press.
Stull, A., & Mayer, R. E. (2021). The case for embodied instruction: The instructor as a source of attentional and social cues in video lectures. Journal of Educational Psychology, 113, 1441-1453.
Stull, A., Fiorella, L., & Mayer, R. E. (2018). An eye-tracking analysis of instructor presence in video lectures. Computers in Human Behavior, 88, 263-272.
Sweller, J. (1999). Instructional design in technical areas. ACER Press.
Sweller, J., Ayres, P., & Kalyuga, S. (2011). Cognitive load theory. Springer.
Sweller, J. (in press). The development of cognitive load theory: Replication crises and incorporation of other theories can lead to theory expansion. Educational Psychology Review.
Vygotsky, L. S. (1978). Mind in society. Harvard University Press.
Wertheimer, M. (1959). Productive thinking. Harper & Row.
Wittrock, M. C. (1974). Learning as a generative activity. Educational Psychologist, 11, 87-95.
Wittrock, M. C. (1989). Generative processes of comprehension. Educational Psychologist, 24, 345-376.
Publisher’s Note Springer Nature remains neutral with regard to jurisdictional claims in published maps and institutional affiliations.

  1. This article is part of the Topical Collection on Theory Development in Educational Psychology.
    Richard E. Mayer
    mayer@psych.ucsb.edu
    1 University of California, Santa Barbara, CA, USA

Journal: Educational Psychology Review, Volume: 36, Issue: 1
DOI: https://doi.org/10.1007/s10648-023-09842-1
Publication Date: 2024-01-17

The Past, Present, and Future of the Cognitive Theory of Multimedia Learning

Richard E. Mayer (D)

Accepted: 25 December 2023 / Published online: 17 January 2024
© The Author(s) 2024

Abstract

The cognitive theory of multimedia learning (Mayer, 2021, 2022), which seeks to explain how people learn academic material from words and graphics, has developed over the past four decades. Although the name and graphical representation of the theory have evolved over the years, the core ideas have been constant-dual channels (i.e., humans have separate information processing channels for verbal and visual information), limited capacity (i.e., processing capacity is severely limited), and active processing (i.e., meaningful learning involves selecting relevant material to be processed in working memory, mentally organizing the material into coherent verbal and visual structures, and integrating them with each other and with relevant knowledge activated from long-term memory). This review describes how the theory has developed (i.e., the past), the current state of the theory (i.e., the present), and new directions for future development (i.e., the future). In addition, the review includes examples of the events and findings that led to changes in the theory. Implications for educational psychology are discussed, including 15 evidence-based principles of multimedia design.

Keywords Multimedia learning Theory development Learning theory Instructional design Meaningful learning

Introduction to the Cognitive Theory of Multimedia Learning

The cognitive theory of multimedia learning (CTML) represents my continuing and evolving attempt to understand how meaningful learning works. Meaningful learning occurs when the learner engages in appropriate cognitive processing during learning, including attending to the relevant information in a lesson (i.e., selecting),
mentally organizing the incoming information into a coherent cognitive structure (i.e., organizing), and connecting it with relevant knowledge activated from longterm memory (i.e., integrating; Mayer, 2021, 2022). Meaningful learning is indicated by performance on transfer tests, which involves being able to use the learned material in new situations. CTML focuses on how people learn meaningfully from academic material containing words and graphics. It focuses on techniques that prime appropriate cognitive processing during learning.
The development of new theories such as CTML is shaped by existing theories. For example, Camp et al. (2022) point out that CTML builds on classic conceptual frameworks from cognitive psychology, including dual-coding theory (Paivio, 1986), multi-stage model of memory (Baddeley, 1986), and cognitive load theory (Sweller, 1999, in press; Sweller et al., 2011). In particular, Camp et al., (2022, p. 17) note:
The power of theories is that they have the potential to remain valid and relevant through generations, while the power of new theories is that they build upon and expand those old theories. You might say that the old theories are the giants upon whose shoulders new theories, and thus new giants, stand. The cognitive theory of multimedia learning (CTML) …can be regarded as one such new giant.
The creation of CTML is clearly a team effort within the field of educational psychology. My modest goal in this essay is to share some introductory insights gleaned from my efforts at theory-building over the past decades, describe the evolution of CTML, summarize the current state of CTML, and speculate on possible future directions for CTML. First, in line with Greene’s (2022) call to carefully examine the process of theory development in educational psychology, I share seven insights about theory building that are exemplified in my decades-long attempts to explain how people learn from multimedia lessons.

Insight 1: Theory Building Depends on Intellectual Curiosity

CTML is a manifestation of my lifelong quest to understand how meaningful learning works. I began my journey on one of those amazing, crisp autumn days in Ann Arbor in 1969, as I started my graduate career in psychology at the University of Michigan. Soon within my first year in graduate school, under the mentorship of James Greeno, I developed a deep curiosity about how meaningful learning works. How can we teach so people can take what they have learned and use it productively in new situations? This seemingly simple question about teaching for transfer has been a driving force in my lab across more than four decades. Specifically, CTML focuses on some fundamental questions about learning and instruction with multimedia materials: How do people learn academic material consisting of words and graphics (i.e., multimedia learning)? How can we help people learn academic material consisting of words and graphics (i.e., design of multimedia instruction)? My curiosity about these kinds of questions is the engine that drives the development of CTML.
How did I get started on this theory-developing journey? During my first year of graduate school, while I was struggling to build my identity as a research
psychologist, I had the good fortune to take a course entitled, Models of Thinking, taught by my advisor, Jim Greeno. That course got me thinking about how people are able to come up with creative solutions to problems, which lead me to a basic question: “How can we help people learn in ways so that they can take what they have learned and apply it to new situations?” This question about teaching for transfer, which formed in my mind during that course, has stuck with me all these years and has driven my research. I soon discovered that this is a classic, albeit elusive, issue both in psychology and in education that dates back to early days of research in learning and instruction.

Insight 2: Theory Building Is Grounded in Old Ideas

The search for theories of meaningful learning has a long history, including the insightful work of the Gestalt psychologists such as Wertheimer (1959) and Katona (1940); the groundbreaking work of developmentalists such as Piaget (1926) and Vygotsky (1978); and the creative work of memory researchers such as Bartlett (1932). In the field of educational psychology, a focus on instruction for meaningful learning has its roots in generative theories of learning by pioneers such as Wittrock (1974, 1989) and Ausubel (1968). Some key ideas rising from this work are meaningful learning as assimilation to schema (i.e., connecting incoming information with existing knowledge), meaningful learning as a generative activity (i.e., actively attending to relevant material, organizing it into a coherent structure, and relating it to relevant prior knowledge), and meaningful learning as knowledge construction (i.e., building mental representations in working memory). The development of CTML represents my attempts to understand and clarify these intriguing ideas based on empirical testing.
How did I get this insight? As an undergraduate, my goal was to read every classic psychology book, but in graduate school, my goal became more focused on reading every classic book related to how learning works and, particularly, books that could help me better understand my driving question of how to teach for transfer. I found amazing used bookstores in Ann Arbor, where I spent a lot of my spare time on a treasure hunt for books by the likes of Piaget (1926), Bartlett (1932), Wertheimer (1959), Katona (1940), Ebbinghaus (1913), Ausubel (1968), and many others. I was moved by the introductory quotation I found on the cover page to Ebbinghaus’ nineteenth century book, Memory: “From the oldest subject we will build the newest science.” Even as a beginning graduate student, I felt privileged to contribute in even a small way to this newest science of how the human mind works, which in my case turned out to the science of learning and instruction.

Insight 3: Theory Building Is Not a Straight, Planned-Out Path

My search for a theory of meaningful learning has not taken a straight, planned-out path, but rather has progressed in an irregular pattern of small steps based on fortuitous findings over decades, with invaluable contributions from a long list of collaborators and colleagues. CTML was not based on a systematic step-by-step career
plan, and it certainly did not pop out of my head one day all in one nice polished package. It came out in fits and starts, with a long series of revisions, refinements, clarifications, deletions, and additions.
Where does this idea come from? I never set out to have a long-term career plan of systematic research on multimedia learning, but rather I have much shorter 2or 3-year plans targeted on specific research questions. For example, back in the 1980s, after reading all of David Ausubel’s (e.g., Ausubel, 1968) writings, I became obsessed with advance organizers-material that is presented before a lesson that is intended to improve learning through activating relevant prior knowledge. That line of research led me to the unexpected conclusion that visual advance organizers could be effective in helping learners relate a new concept with familiar prior knowledge, which got me thinking about the power of connecting visual and verbal representations as a route to meaningful learning. As that idea incubated in my mind throughout the late 1980s and 1990s, I became interested in how to incorporate illustrations in text. That fateful exploration brought me to the formulation of what was to become the multimedia principle-people learn better from words and pictures than from words alone. In short, I often do not know where my theory-building is going but I simply follow the fruitful paths that my current research takes me.

Insight 4: Theory Building Is an Engineering Problem

Based on this journey, I have come to realize that theory building in educational psychology is much like solving a practical engineering problem. However, instead of building an increasingly better device to carry out some function, our theorybuilding task is to build a progressively better explanation of some educationally relevant phenomenon (such as how students develop meaningful learning that transfers to new situations). I just keep tinkering with the theory trying to make it work better based on new research evidence and logical reasoning. One indication of working better is the rate at which the work is cited by others and incorporated into their frameworks, as documented by Camp et al. (2022).
Where does this insight come from? When I look at the evolution of CTML, particularly through the ways I represented it visually, I see that I started with a core idea-there are several cognitive conditions for meaningful learning-and then continually tweaked the idea based on the research evidence that it generated and the new ideas I came across. When I read Paivio’s (1986) work on dual-coding, I realized its relevance and tried to incorporate that idea. When I read Miller’s (1956) and Baddeley’s (1986) and Sweller’s (1999) work on limited working memory capacity, I realized that fundamental idea had to be part of my theorizing. When I read Wittrock’s work on generative learning, it validated my thinking that appropriate cognitive processing during learning was a key to meaningful learning and led to my incorporating the SOI model (based on selecting, organizing, and integrating). As in engineering, my approach has been to keep redesigning what I have to make it bet-ter-which in my case means making it better able to explain a wider set of findings. In this way, my work began with what Kuhn (1962) would call a paradigm shift-a
shift from behaviorist to cognitive views of how learning works-but then for all these ensuing years has involved continually improving on my original idea.

Insight 5: Theory Building Is an Iterative Process Involving the Persistent Interplay Between Research and Theory

As shown in Fig. 1, consistent with Greene (2022), I start with the kernel of a theoretical idea (i.e., theory), which leads me to a testable question (i.e., research question) that I examine in series of experiments (research design), which generates a pattern of findings (research evidence) that helps me improve my theoretical account (theory). The development of CTML represents many turns around the circle presented in the figure (both clockwise and counterclockwise). These turns depend on valuable discussions with colleagues concerning how to frame the next version of the theory, how to generate useful research questions (and know when to give up on unfruitful ones), how to design impactful studies, and how to interpret the results. The result is a series of iterations of a theory of how meaningful learning works, as described in the following sections.
Where did I get this insight? Let me give an example. Most of the early work by my collaborators and me on instructional design principles for multimedia learning focused on the instructional goal of reducing extraneous processing-that is, reducing the learner’s cognitive processing that is not directed towards learning the content so that the learner can use cognitive resources to make sense of the material. This led, for example, to the coherence principle in which people learn better when we remove unneeded visual and verbal material from a lesson. However, for some lessons, even when we eliminated unneeded material, students still had trouble learning it, perhaps because they just did not want to put out effort to make sense of
Fig. 1 The theory-research cycle
the material. This led us to develop a new kind of instructional design goal, which I called fostering generative processing-motivating the learner to actively engage with the material. This goal suggested a whole new set of multimedia learning techniques based on prompts to engage in generative learning activities during learning, such as writing a summary, drawing an illustration, creating a graphic organizer, and explaining to others. In this way, the research evidence (i.e., not being able to improve learning through reducing extraneous material), led to a new theoretical idea (i.e., fostering generative processing) which led to new research avenues (i.e., incorporating generative learning activities).

Insight 6: Theory Building Depends on Persistence in Collecting New Research Evidence

Also in line with Fig. 1, building the cognitive theory of multimedia learning depends on a persistent commitment to experimental comparisons using a valueadded design. In value-added experiments, we compare the learning outcomes (and, when possible, learning processes) of people who learn from a base version of a multimedia lesson with those of people who learn from the lesson with one feature added. For example, we can compare learning from a narrated animation on lightning formation versus learning from the same lesson with the words presented as printed captions at the bottom of the screen. Theory development depends on a strong foundation of research evidence, which flows from a willingness to replicate effects detected in value-added studies.
Where did this insight come from? Let me give you an example. When Roxana Moreno was a graduate student in my lab, she came to my office with the preposterous (to my way of thinking) idea that using conversational language in an online science lesson would improve learning outcomes over our existing lessons using traditional, formal language. In spite of my skepticism, we worked out plans for a series of rigorous experiments, each one of which came back with strong positive results. After replicating the effect multiple times with multiple content topics, I finally allowed myself to share the personalization principle with the larger research community, that is, the idea that people learn better when instructors use conversational wording rather than formal wording. This opened my eyes to the idea that online multimedia learning depended not only on cognitive processing, but also social and affective processing, which has led to several ongoing new directions for our research (Horovitz & Mayer, 2021; Lawson & Mayer, 2022; Lawson et al., 2021).

Insight 7: Theory Building Is a Team Activity

CTML would not have happened if I was tasked with working alone. I have had the pleasure of working with dozens of collaborators over the years who have helped build CTML. The theory benefits from collaborations with students, campus colleagues, and fellow educational psychologists from near and far, including visitors from around the world who have contributed to our lab over the years. The theory has been shaped by advances and feedback from the larger community of scholars,
many of whom are represented in the various editions of The Cambridge Handbook of Multimedia Learning (Mayer, 2005, 2014; Mayer & Fiorella, 2022). CTML also has benefitted from ideas from competing theories such as cognitive load theory (Paas & Sweller, 2022; Sweller, 1999, in press; Sweller et al., 2011) or the integrated model of text and picture comprehension (Schnotz, 2022, 2023). Part of theory building is being able to convince your peers and to be convinced by them.
Where did this insight come from? As I look over the hundreds of research papers on multimedia media that have my name on them, I see that the vast majority were coauthored with graduate students or visitors to my lab. I seek to meet on a weekly basis with our lab research team—graduate students, postdocs, and visitors. I also meet regularly with students, visitors, colleagues, and anyone else I can find who is interested in talking about improving multimedia instruction. I cherish these meetings because they are essential in giving me a chance to work out new ideas about multimedia learning.

The Past of the Cognitive Theory of Multimedia Learning

I did not plan to spend a substantial portion of my academic career on developing the cognitive theory of multimedia learning. In this section, I briefly describe how it happened, including how I stumbled upon an appropriate name and a concise visual representation, how I searched for a conceptual framework, and how CTML has grown in terms of research base and design principles.

Stumbling Upon a Name for the Theory

An important challenge in theory development is to find a name that highlights the key concepts in the theory. Table 1 summarizes the names leading up to the cognitive theory of multimedia learning, which highlighted an evolving collection of inter-related concepts. I began with “model of meaningful learning” (Mayer, 1989), which focused on the external conditions for instruction for meaningful learningnamely, having potentially meaningful material, having learners who need help, having illustrations that provide help, and having a test that can detect meaningful learning outcomes. I changed the name to “model of conditions for effective illustrations” in Mayer & Gallini (1990) but retained the same set of conditions albeit in a different order.
How did I progress to the next levels? In continually discussing our theoretical account with students and colleagues, it became clear that this initial model captured the external factors involved in meaningful learning but did not adequately address the internal cognitive processes involved. If I wanted to know how meaningful learning works, I would have to consider the cognitive processes during learning. I was heavily influenced by three threads of scholarship I had been reading about-dual-coding such as articulated by Paivio (1986), limited working memory capacity such as articulated by Miller (1956) and Baddeley (1986) and Sweller (1999), and active cognitive processing during learning such as articulated by Wittrock (1974, 1989). First, I focused on dual-coding.
Table 1 Name changes leading to the cognitive theory of multimedia learning and beyond
Name Emphasis Initial source(s)
Model of meaningful learning Conditions for instruction for meaningful learning Mayer (1989)
Model of conditions for effective illustrations Conditions for instruction for meaningful learning Mayer & Gallini (1990)
Dual-coding model Dual-coding Mayer & Anderson
Dual-processing model of multimedia learning or dual-processing model of working memory Dual-coding Mayer & Moreno (1998);
SOI model Generative processes Mayer (1996)
Generative theory Generative processes Mayer et al. (1995)
Generative theory of multimedia learning Generative processes Mayer (1997); Plass et al. (1998)
Generative learning theory Generative processes Fiorella & Mayer (2015, 2016);
Generative theory of learning Generative processes Mayer (2010)
Cognitive theory of multimedia learning Generative processes Mayer (1997); Mayer et al., (1996, 1999); Moreno & Mayer (2000); Mayer (2001); Mayer, et al. (2001); Mayer & Moreno, 2003)
As a result of my dissatisfaction with a focus solely on external conditions of meaningful learning, the names shifted to focus on the internal conditions for meaningful learning by considering cognitive processing in the learner’s information processing system. Different names emphasized different aspects of cognitive processing such as having dual-channels for verbal and visual material, having limited capacity for cognitive processing, and engaging in generative processing during learning. First, I emphasized the concept of dual-coding (i.e., separate information processing channels for auditory and visual material) with names like “dual-coding model” (Mayer & Anderson, 1991, 1992) and “dual-processing model of multimedia learning” or “dual-processing theory of working memory” (Mayer & Moreno, 1998). The idea of separate channels for processing visual and verbal material was to become a central feature of CTML, as represented by the two rows in the current model.
Then, the name was broadened to differentiate among three cognitive processes during learning-selecting relevant material for further processing, organizing it into a coherent cognitive representation, and integrating it with relevant prior knowledge. Mayer (1996) referred to this idea as the “SOI model,” and other papers used the term “generative theory” (Mayer, 1997; Mayer et al., 1995) or “generative theory of multimedia learning” (Mayer, 1997; Plass et al., 1998) or “generative learning theory” (Fiorella & Mayer, 2015, 2016) or “generative theory of learning” (Mayer, 2010). The SOI model was a major conceptual breakthrough for me, and has remained at the core of CTML ever since, as represented by the arrows in the current model. In short, the SOI model represents the core cognitive processes that drive CTML.
Finally, we began using the name, “cognitive theory of multimedia learning” in Mayer et al., (1996, 1999), Mayer (1997), and Moreno & Mayer (2000). We also elaborated on the underlying ideas of the cognitive theory of multimedia learning in Mayer & Moreno (2003) and all editions of Multimedia Learning (Mayer, 2001, 2009, 2021) and all editions of The Cambridge Handbook of Multimedia Learning (Mayer, 2005, 2014; Mayer & Fiorella, 2022). This approach included the idea of limited capacity and the distinction among extraneous, essential, and generative processing in which cognitive capacity directed at extraneous processing reduced the capacity available for essential and generative processing.
How am I progressing beyond the current model of CTML? Research evidence came pouring in that alerted me to the idea that there may be more to multimedia learning than cognitive processing. We began to find evidence for the role of social process (e.g., how using conversational language can build social rapport) and affective processing (e.g., how the instructor’s gestures and tone of voice can affect learning), and evidence for the role of motivational factors (e.g., benefits of training for self-efficacy in multimedia lessons) and metacognitive factors (e.g., role individual differences in executive function in learning from distracting lessons). We are now grappling with how to represent these additions to CTML.
As we move to expand CTML, as summarized in Table 2, we supplemented CTML with “social agency theory” (Atkinson et al., 2005; Mayer et al., 2003), which incorporates social processes during learning, and with the “cognitive-affective theory of learning with media” (Moreno & Mayer, 2007) and the “cognitiveaffective model of e-learning” (Lawson & Mayer, 2022; Lawson et al., 2021), which incorporates affective processes during learning.
Table 2 Adjunct theories to the cognitive theory of Multimedia Learning
Name Emphasis Initial source(s)
Social agency theory Social processing Mayer et al. (2003); Atkinson et al. (2005)
Cognitive affective model of learning with media Affective processing Moreno & Mayer (2007)
Cognitive affective model of e-learning Affective processing Lawson et al. (2021); Lawson & Mayer (2022)
The name changes reflect a shift from a focus on external conditions to internal processes ranging from dual-coding processing to generative processing to social and affective processing. Although it took us more than a decade to get there, throughout the twenty-first century, we have landed on the “cognitive theory of multimedia learning” as the name of our theory.

Inching Towards a Visual Representation of the Theory

Although it took many iterations to find a suitable name, we also struggled with finding an appropriate visual representation of the theory. I have found that visual representations help me better understand and improve on the theory, so I generally start with a visual representation and then express my ideas in words. In the case of CTML, it took many tries at building a flowchart that could represent the theory concisely and accurately. Our earliest attempts are shown in Figs. 2 and 3, which depict the external conditions for effective multimedia instruction-having meaningful text, having complimentary illustrations, having learners who need help, and having a test that taps meaningful learning (Mayer, 1989; Mayer & Gallini, 1990).
Next, we shifted from a vertical flowchart depicting external conditions of meaningful learning to a vertical flowchart depicting steps in a dual-coding model (in Fig. 4; Mayer & Anderson, 1992). In a further refinement of the dual-coding model, we flipped to a horizontal flowchart involving a visual channel and an acoustic channel (in Fig. 5; Mayer & Moreno, 1998). Around the same time, we developed a more inclusive flowchart based on a generative theory that broadened the cognitive processes to include selecting, organizing, and integrating, but without the dual channels (in Fig. 6; Mayer, 1996). Figure 7 shows a flowchart version of generative theory (with selecting, organizing, and integrating) that also begins to incorporate dual channels involving text and illustrations (Mayer, 1997; Mayer et al., 1995).
Finally, in Fig. 8 (Mayer, 2001; Mayer et al., 2001), we refined those previous flowcharts to include all three features of the theory: dual-channels as represented by an auditory row across the top and a visual row across the bottom; limited capacity as represented by boxes for sensory memory, working memory, and long-term memory; and generative processing as indicated by arrows for selecting, organizing, and integrating. This has become the stable flowchart representation we have used to depict the cognitive theory of multimedia learning throughout the twenty-first century. It is the single most important representation of CTML, and it continually helps me think about how multimedia learning
Fig. 2 External conditions for meaningful learning (Mayer, 1989)
works and the implications for instructional design. On reflection, it seems fitting that the most important statement of CTLM is itself a multimedia representation consisting of words and graphics.
Going beyond the standard flowchart for CTML in Fig. 8, we also have added some complementary flowcharts for social agency theory (Mayer, 2009), which adds social processing, and for the cognitive-affective model (Lawson & Mayer, 2022; Moreno & Mayer, 2007), which adds affective processing. The changes in our
Fig. 3 Alternative version of external conditions for meaningful learning (Mayer & Gallini, 1990)
flowchart reflect refinements and additions in the theory, as we grappled with how to integrate an inter-related set of concepts about dual channels, limited capacity, and active processing.
Fig. 4 Dual-coding model (Mayer & Anderson, 1992)

Adding to the Research Base

Across four decades, the research base for the cognitive theory of multimedia learning has grown substantially, which enabled further theory development. Table 3 shows the number of experimental tests conducted by my colleagues and me as well as the number of multimedia design principles we have proposed based on those studies across the three editions of Multimedia Learning (Mayer, 2001, 2009, 2021). Starting with our first multimedia learning studies in 1989, we have been able to generate 15 evidence-based principles based on more than 200 experiments conducted by my colleagues and me.
Table 4 lists the principles that were included in each of the three editions of Multimedia Learning. As can be seen, we began mainly with principles aimed at minimizing extraneous processing-cognitive processing that does not support the instructional goal-such as eliminating unneeded material (i.e., coherence principle). Then,
Fig. 5 Dual-processing theory of working memory (Mayer & Moreno, 1998)
Fig. 6 The SOI model (Mayer, 1996)
Fig. 7 Generative theory of textbook design (Mayer, 1997; Mayer et al., 1995)
Fig. 8 Cognitive theory of multimedia learning (Mayer, 2001; Mayer et al., 2001)
Table 3 Growth of research base across three editions of multimedia learning
Edition Year
Number of experimental
comparisons
Number of
principles
1 2001 45 7
2 2009 93 12
3 2021 201 15
Table 4 Growth of principles across three editions of multimedia learning
Principle First edition (2001) Second edition (2009) Third edition (2021)
Multimedia X X X
Coherence X X X
Signaling X X
Redundancy X X X
Spatial contiguity X X X
Temporal contiguity X X X
Segmenting X X
Pretraining X X
Modality X X X
Personalization X X
Voice X X
Image X X
Embodiment X
Immersion
Generative Activity X
we added principles aimed at managing essential processing-cognitive processing aimed at representing the material in working memory-such as pausing a continuous video to create self-paced segments (i.e., segmenting principle). Lastly, we added principles aimed at fostering generative processing-cognitive processing aimed at making sense of the material-mainly with new technologies such as asking learners to summarize or explain what they are learning (i.e., generative activity principle).
Of course, the growth of the research base supporting CTML goes far beyond what our lab produces and includes an ever expanding network of researchers around the world. As summarized in Table 5, some of this work is described in the three editions of The Cambridge Handbook of Multimedia Learning (Mayer, 2005, 2014; Mayer & Fiorella, 2022).
This growth in the research base is supported by improvements in assessment of learning outcomes-especially the development of appropriate transfer tests. I am a strong proponent of replication and for searching for boundary conditions under which the various design principles apply. Overall, theory development depends on a storehouse of research evidence generated by labs around the world.

The Present State of the Cognitive Theory of Multimedia Learning

The cognitive theory of multimedia learning is an evidence-based description of how people learn from multimedia instructional messages. A multimedia instructional message is instructional material consisting of words (e.g., printed text or spoken text) and graphics (e.g., illustrations, photos, animation, video, or immersive virtual reality) intended to foster new knowledge or skills in a learner. A multimedia instructional message can be presented in print (e.g., as a book), on a computer screen (e.g., as an instructional video or narrated animation or a simulation game), or in virtual reality via a head-mounted display (e.g., as an interactive simulation). The theory yields implications for the design of effective multimedia instructional messages, which are rendered as design principles.
Some of the advances in CTML have been fostered by advances in educational technology including instructional video, animation technology, technologies for creating onscreen agents, immersive virtual reality, and educational games, but it was not my intention to study educational technology per se. In fact, the theory began by studying learning from printed text and illustrations rendered on paper, and my focus has always been on how to design effective instruction involving words and graphics. In short, my focus is on how to help people learn academic content rather than on the capabilities of the latest educational technologies.
In this section, I summarize the current state of the cognitive theory of multimedia learning including the guiding assumptions, the memory stores, the cognitive processes, the demands on cognitive capacity, and three instructional goals. I also summarize 15 evidence-based multimedia instructional design principles based on CTML. More detailed descriptions are available in Mayer .
Table 5 Growth of research base across three editions of the Cambridge Handbook of Multimedia Learning
Edition Year Chapters Principles Authors
1 2005 35 22 46
2 2014 34 25 52
3 2022 46 31 60
The cognitive theory of multimedia learning is represented in Fig. 8. A multimedia instructional message enters the learner’s cognitive system through their eyes and ears. Printed words and graphics are held briefly in visual sensory memory, and spoken words are held briefly in auditory sensory memory. As these images fade, the learner can pay attention to some of the material, which is transferred to working memory for further processing. In working memory, the learner can organize the pictorial material into a pictorial model and the verbal material into a verbal model and integrate corresponding pictorial and verbal representations with each other and with relevant knowledge from long-term memory. The outcome is meaningful knowledge that is stored in long-term memory and can be applied to new situations.

Guiding Assumptions of the Cognitive Theory of Multimedia Learning

The cognitive theory of multimedia learned as represented in Fig. 8 is based on three guiding assumptions derived from cognitive science: dual channels, limited capacity, and active processing. The dual-channels assumption is that humans have separate but interacting channels for processing auditory/verbal information and pictorial/visual information (such as narration and animation, respectively). The limited-capacity assumption is that humans can process only a few pieces of information in each channel at one time. The active-processing assumption is that meaningful learning occurs when the learner engages in appropriate cognitive processing during learning, including selecting relevant material to attend to in a lesson, mentally organizing the incoming material into a coherent representation in working memory, and mentally connecting it with corresponding representations and with relevant prior knowledge activated from long-term memory.

Three Memory Stores in the Cognitive Theory of Multimedia Learning

CTML has three memory stores, which are represented as boxes in Fig. 8 sensory memory, working memory, and long-term memory. Sensory memory holds complete visual images (in visual sensory memory) that enter through the eyes and complete auditory images (in auditory sensory memory) that enter through the ears, but the images fade rapidly within a fraction of a second. Working memory holds pictorial/visual and auditory/verbal pieces of information that the learner has attended to before they decay from sensory memory. This information can be re-arranged, but only a few pieces of information can be processed in each channel at any one time. Long-term memory is the learner’s permanent storehouse of knowledge, parts of which can be activated and brought into working memory during learning.

Five Cognitive Processes in the Cognitive Theory of Multimedia Learning

CTML has five cognitive processes, which are represented as arrows in Fig. 8: selecting words, selecting images, organizing words, organizing images, and
integrating. Selecting words refers to attending to relevant parts of the printed text, and selecting images refers to attending to relevant parts of the presented graphics. Organizing words refers to arranging the relevant words in to a verbal model in working memory, and organizing images refers to arranging the relevant parts of the graphics into a pictorial model in working memory. Integrating refers to making connections between corresponding verbal and pictorial representations in working memory as well as relevant knowledge from long-term memory. Meaningful learning depends on the learner engaging in appropriate cognitive processing involving selecting, organizing, and integrating. Instructional design is intended to guide these processes.

Three Demands on Cognitive Capacity

A central tenet of the cognitive theory of multimedia learning is that working memory capacity is limited, but there are three demands on that limited cognitive capacity during learning: extraneous processing, essential processing, and generative processing. Extraneous processing is cognitive processing that does not support the instructional goal; the amount of extraneous processing depends on the degree of poor instructional design, such as presenting extraneous verbal or pictorial information in a lesson. Essential processing is cognitive processing to mentally represent the presented material in working memory; the amount of essential processing depends on the inherent complexity of the material for the learner, such as presenting many inter-related concepts in a fast-paced lesson. Generative processing is cognitive processing aimed at making sense of the incoming information; the amount of generative processing depends on the learner’s level of motivation to exert effort to understand the lesson. The three kinds of processing each require some of the learner’s limited cognitive capacity, so capacity that is used for extraneous processing takes away from capacity that could be used for essential and generative processing, and cognitive capacity that is used for essential processing takes away capacity that could be used for generative processing.

Three Instructional Goals

The three demands on cognitive capacity give rise to three instructional goals: minimize extraneous processing, manage essential processing, and foster generative processing. Consider a situation in which a poorly designed lesson causes the learner to allocate almost all of their cognitive capacity to extraneous processing, so they do not have adequate remaining cognitive capacity to engage in needed essential and generative processing. In this case, an important instructional goal is to minimize extraneous processing. This can be accomplished, for example, by eliminating unneeded words and graphical elements from a lesson.
Consider another situation in which extraneous processing has been reduced, but the lesson is so complex that the amount of needed essential processing exceeds the learner’s cognitive capacity. In this case, an important instructional goal is to
manage essential processing. This can be accomplished, for example, by breaking a continuous lesson into manageable chunks that can be paced by the learner.
Finally, let us assume that we have minimized extraneous processing and managed essential processing, so cognitive capacity is available for generative processing, but the learner is not motivated to exert effort to understand the material. In this case, an important instructional goal is to foster generative processing. This can be accomplished, for example, by prompting the learner to engage in a generative learning activity such as writing a summary or self-testing during pauses a lesson.

Fifteen Multimedia Instructional Design Principles

Table 6 summarizes 15 principles supported by research by my colleagues and me over the years. The first set of five principles addresses the instructional goal of reducing extraneous processing; the second set of four principles addresses the instructional goal of managing essential processing; and the third set of six principles addresses the instructional goal of fostering generative. Each principle is subject to boundary conditions including for whom the principle applies, for which kind of lesson the principle applies, and under what circumstances the principle applies. These are described in more detail in Multimedia Learning (Mayer, 2021). Many more principles are described in the wider literature, such as in The Cambridge Handbook of Multimedia Learning (Mayer & Fiorella, 2022).

The Future of the Cognitive Theory of Multimedia Learning

Even when a theory reaches a somewhat stable state, such as the cognitive theory of multimedia learning, there is still room for further theory development. Today’s version of CTML focuses mainly on cognitive processing during learning-such as selecting, organizing, and integration-as the core mechanism along with assumptions about the architecture of the human information processing system, limited capacity of working memory and dual channels for visual and verbal processing. In this section, I explore future directions for CTML involving the integration of new learning components that go beyond these basic cognitive processes, such as social processes, affective processes, motivational processes, and metacognitive processes. In the future, I also expect an increase in the research base, an increase in the number of evidence-based design principles, and a clearer specification of boundary conditions for design principles.

Integrating New Components into the Cognitive Theory of Multimedia Learning

Progress is being made in integrating understudied components into the cognitive theory of multimedia learning, including social, affective, motivational, and metacognitive processes. Concerning social processes, initial progress is reflected in the incorporation of social agency theory (Atkinson et al., 2005; Mayer et al., 2003), which posits that learners try harder to understand a lesson when they feel that the
Table 6 Fifteen principles of multimedia instructional design (from Mayer, 2021)
Principle for reducing extraneous processing Effect size Tests
1. Coherence principle: People learn better when extraneous material is excluded rather than included 0.86 19
2. Signaling principle: People learn better when cues are added that highlight the organization of the essential material 0.69 16
3. Redundancy principle: People do not learn better when printed text is added to graphics and narration; people learn better from graphics and narration than from graphics, narration, and printed text, when the lesson is fast-paced 0.10 12
4. Spatial contiguity principle: People learn better when corresponding words and pictures are presented near rather than far from each other on the page or screen 0.82 9
5. Temporal contiguity principle: People learn better when corresponding words and pictures are presented simultaneously rather than successively 1.31 8
Principles for managing essential processing Effect size Tests
6. Segmenting principle: People learn better when a multimedia lesson is presented in user-paced segments rather than as a continuous unit 0.67 7
7. Pretraining principle: People learn better from a multimedia lesson when they know the names and characteristics of the main concepts 0.78 10
8. Modality principle: People learn better from graphics and narration than from graphics and on-screen text 1.00 19
Principles for managing essential processing Effect size Tests
9. Multimedia principle: People learn better from words and pictures than from words alone 1.35 13
10. Personalization principle: People learn better from multimedia lessons when words are in conversational style rather than formal style 1.00 15
11. Voice principle: People learn better when the narration in multimedia lessons is spoken in a friendly human voice rather than a machine voice 0.74 7
12. Image principle: People do not necessarily learn better from a multimedia lesson when the speaker’s image is added to the screen 0.20 7
13. Embodiment principle: People learn more deeply from multimedia presentations when an onscreen instructor displays high embodiment rather than low embodiment 0.58 17
14. Immersion principle: People do not necessarily learn better in 3D immersive virtual reality than with a corresponding 2D desktop presentation -0.10 9
15. Generative activity principle: People learn better when they are guided in carrying out generative learning activities during learning 0.71 44
instructor is working with them. Concerning affective processes, initial progress is reflected in the incorporation of the cognitive-affective model of learning with media (Moreno & Mayer, 2007) and the cognitive-affective model of e-learning (Lawson et al., 2021; Lawson & Mayer, 2022), which posit that learners try harder to understand a lesson when they experience positive emotion while learning. Concerning motivational processes, initial progress is reflected in research showing students learn better from a statistics lesson when they are given prompts intended to boost their self-efficacy and decrease anxiety during learning (Huang & Mayer, 2019; Huang et al., 2020). Concerning metacognitive processes, initial progress is reflected in research assessing learners’ judgements of understanding during pauses in a multimedia science lesson (Pilegard & Mayer, 2015a, 2015b).
Overall, more work is needed to incorporate new components into the cognitive theory of multimedia learning, especially given ongoing advances in theories of self-regulated learning and motivation. For example, Kuhlmann et al. (2023) have shown how the SOI processes in CTML can be expanded through a motivational theory perspective. Clearly, self-regulation plays an important role in understanding how students learn from multimedia materials and in understanding how to design multimedia instructional materials for students with different kinds of self-regulation skills.

Expanding Research Methodologies to Monitor Learning Processes

In order to incorporate new components into the CTML, we need to expand the research methodologies used to monitor learning processes, including the use of eye-tracking, biometric, brain monitoring, and survey techniques. Concerning eyetracking techniques, progress is being in determining how learners allocate their attention in viewing a multimedia lesson, such as how many times their eyes move between corresponding printed words and graphical elements (Johnson & Mayer, 2012; Ponce et al., 2018) or where students look when viewing a video lecture consisting of an instructor standing next to projected slides (Stull & Mayer, 2021; Stull, et al., 2018). Concerning biometric techniques, initial progress is reflected in studies examining students’ emotional arousal as measured by heart rate variability and electro-dermal activity when learning in immersive virtual reality versus with conventional media (Parong & Mayer, 2021a, 2021b). Concerning brain monitoring techniques, initial progress is reflected in studies examining students’ level of distraction as measured by a portable electroencephalogram (EEG) system when learning in immersive virtual reality versus with conventional media (Parong & Mayer, 2021a, 2021b). Similarly, functional near-infrared spectroscopy (fNIRS) technology offers a potential avenue for detecting the intensity of activity in brain areas related to cognitive, social, and affective processing (Li et al., 2022). The traditional way to measure learning activities is through self-report surveys administered after learning, but initial progress is being made in injecting brief survey items at pauses within an ongoing lesson (Pilegard & Mayer, 2015a, 2015b). Overall, I expect advances in methodologies aimed at detecting learning processes during an instructional episode, which will complement existing techniques to measure learning outcomes.

Expanding the Knowledge Base

Finally, I expect the cognitive theory of multimedia learning to be fortified with an increase in the research base, which will enable an increase and refinement in design principles and a clearer specification of boundary conditions for when a principle is most likely to apply. As the research base grows, I expect to see more meta-analyses that pinpoint the strength of key multimedia design principles as well as their moderating factors. An important direction for future research is to conduct studies in more natural learning environments such as school classrooms, online courses, and professional training. The ultimate test of the value of the cognitive theory of multimedia learning rests in its practical role in improving instruction and training as reflected in the five editions of e-Learning and the Science of Instruction (Clark & Mayer, 2003, 2008, 2011, 2016, 2024).

Conclusion

The cognitive theory of multimedia represents one of educational psychology’s success stories by showing progress in addressing some of our discipline’s fundamental questions about learning and instruction: How do people learn and how can we help people learn? In particular, the CTML represents our attempts to understand how meaningful learning of academic material works and how to improve the design of academic material to foster meaningful learning. For more than 100 years, our field has grappled with these questions. The development of the cognitive theory of multimedia learning provides a case example of how educational psychology can contribute to psychological theory and educational practice. I will consider this essay to be a success, if it encourages you to join this worthwhile effort, such as by conducting theory-grounded studies of meaningful academic learning, contributing to research-based theories of meaningful academic learning, or developing evidencebased instruction.
Funding The preparation of this paper was supported by grant N00014-21-1-2047 from the Office of Naval Research.
Open Access This article is licensed under a Creative Commons Attribution 4.0 International License, which permits use, sharing, adaptation, distribution and reproduction in any medium or format, as long as you give appropriate credit to the original author(s) and the source, provide a link to the Creative Commons licence, and indicate if changes were made. The images or other third party material in this article are included in the article’s Creative Commons licence, unless indicated otherwise in a credit line to the material. If material is not included in the article’s Creative Commons licence and your intended use is not permitted by statutory regulation or exceeds the permitted use, you will need to obtain permission directly from the copyright holder. To view a copy of this licence, visit http://creativecommons.org/ licenses/by/4.0/.

References

Atkinson, R. K., Mayer, R. E., & Merrill, M. M. (2005). Fostering social agency in multimedia learning: Examining the impact of an animated agent’s voice. Contemporary Educational Psychology, 30(1), 117-139.
Ausubel, D. P. (1968). Educational psychology: A cognitive view. Holt, Rinehart, & Winston.
Baddeley, A. (1986). Working memory. Oxford University Press.
Bartlett, F. C. (1932). Remembering. Cambridge University Press.
Camp, G., Surma, T., & Kirschner, P. A. (2022). Foundations of multimedia learning. In R. E. Mayer & L. Fiorella (Eds.), The Cambridge handbook of multimedia learning (3rd ed., pp. 17-24). Cambridge University Press.
Clark, R. C., & Mayer, R. E. (2003). e-Learning and the science of instruction. Jossey-Bass.
Clark, R. C., & Mayer, R. E. (2008). e-Learning and the science of instruction (2nd ed.). Jossey-Bass.
Clark, R. C., & Mayer, R. E. (2011). e-Learning and the science of instruction (3rd ed.). Pfeiffer.
Clark, R. C., & Mayer, R. E. (2016). e-Learning and the science of instruction (4th ed.). Wiley.
Clark, R. C., & Mayer, R. E. (2024). e-Learning and the science of instruction (5th ed.). Wiley.
Ebbinghaus, H. (1913 [1885]). Memory: A contribution to experimental psychology. Teachers College Columbia University.
Fiorella, L., & Mayer, R. E. (2015). Learning as a generative activity: Eight learning strategies that promote understanding. Cambridge University Press.
Fiorella, L., & Mayer, R. E. (2016). Eight ways to promote generative learning. Educational Psychology Review, 28(4), 717-741.
Greene, J. A. (2022). What can educational psychology learn from, and contribute to, theory development scholarship. Educational Psychology Review, 34, 3011-3035.
Horovitz, T., & Mayer, R. E. (2021). Learning with human and virtual instructors who display happy or bored emotions in video lectures. Computers in Human Behavior, 119, 106724.
Huang, X., & Mayer, R. E. (2019). Adding self-efficacy features to an online statistics lesson. Journal of Educational Computing Research, 57, 1003-1037.
Huang, X., Mayer, R. E., & Esher, E. (2020). Better together: Effects of four self-efficacy building strategies on online statistical learning. Contemporary Educational Psychology, 63, 101924.
Johnson, C., & Mayer, R. E. (2012). An eye movement analysis of the spatial contiguity effect in multimedia learning. Journal of Experimental Psychology: Applied, 18, 178-191.
Katona, G. (1940). Organizing and memorizing. Columbia University Press.
Kuhlmann, S. L., Bernacki, M. L., Greene, J. A., Hogan, K. A., Evans, M., Plumley, R., …, & Panter, A. (2023). How do students’ achievement goals relate to learning from well-designed instructional videos and subsequent exam performance?. Contemporary Educational Psychology, 73, 102162.
Kuhn, T. (1962). The structure of scientific revolutions. University of Chicago Press.
Lawson, A., & Mayer, R. E. (2022). Does the emotional stance of human and virtual instructors in instructional videos affect learning processes and outcomes? Contemporary Educational Psychology, 70, 102080.
Lawson, A. P., Mayer, R. E., Adamo-Villani, N., Benes, B., Lei, X., & Cheng, J. (2021). The positivity principle: Do positive instructors improve learning from video lectures? Educational Technology Research and Development, 69(6), 3101-3129.
Li, W., Wang, F., Mayer, R. E., & Liu, T. (2022). Animated pedagogical agents enhance learning outcomes and brain activity during learning. Journal of Computer Assisted Learning, 38, 621-637.
Mayer, R. E. (1989). Systematic thinking fostered by illustrations in scientific text. Journal of Educational Psychology, 81, 240-246.
Mayer, R. E. (1996). Learning strategies for making sense out of expository text: The SOI model for guiding three cognitive processes in knowledge construction. Educational Psychology Review, 8(4), 357-371.
Mayer, R. E. (1997). Multimedia learning: Are we asking the right questions? Educational Psychologist, 32, 1-19.
Mayer, R. E. (2001). Multimedia learning. Cambridge University Press.
Mayer, R. E. (Ed.). (2005). The Cambridge handbook of multimedia learning. Cambridge University Press.
Mayer, R. E. (2009). Multimedia learning (2nd ed.). Cambridge University Press.
Mayer, R. E. (2010). Merlin C. Wittrock’s enduring contributions to the science of learning. Educational Psychologist, 45, 46-50.
Mayer, R. E. (Ed.). (2014). The Cambridge handbook of multimedia learning (2nd ed.). Cambridge University Press.
Mayer, R. E. (2021). Multimedia learning (3rd ed.). Cambridge University Press.
Mayer, R. E. (2022). Cognitive theory of multimedia learning. In R. E. Mayer & L. Fiorella (Eds.), The Cambridge handbook of multimedia learning (3rd ed., pp. 57-72). Cambridge University Press.
Mayer, R. E., & Fiorella, L. (Eds.). (2022). The Cambridge handbook of multimedia learning (3rd ed.). Cambridge University Press.
Mayer, R. E., & Anderson, A. B. (1991). Animations need narrations: An experimental test of a dualcoding hypothesis. Journal of Educational Psychology, 83, 484-490.
Mayer, R. E., & Anderson, A. B. (1992). The instructive animation: Helping students build connections between words and pictures in multimedia learning. Journal of Educational Psychology, 84, 444-452.
Mayer, R. E., & Gallini, J. (1990). When is an illustration worth ten thousand words? Journal of Educational Psychology, 82, 715-727.
Mayer, R. E., & Moreno, R. (1998). A split-attention effect in multimedia learning. Journal of Educational Psychology, 90, 312-320.
Mayer, R. E., & Moreno, R. (2003). Nine ways to reduce cognitive load in multimedia learning. Educational Psychologist, 38, 43-52.
Mayer, R. E., Steinhoff, K., Bower, G., & Mars, R. (1995). A generative theory of textbook design: Using annotated illustrations to foster meaningful learning of science text. Educational Technology Research and Development, 43, 31-43.
Mayer, R. E., Bove, W., Bryman, A., Mars, R., & Tapangco, L. (1996). When less is more: Meaningful learning from visual and verbal summaries. Journal of Educational Psychology, 88, 64-73.
Mayer, R. E., Moreno, R., Boire, M., & Vagge, S. (1999). Maximizing constructivist learning from multimedia communications by minimizing cognitive load. Journal of Educational Psychology, 91, 638-643.
Mayer, R. E., Heiser, J., & Lonn, S. (2001). Cognitive constraints on multimedia learning: When presenting more material results in less understanding. Journal of Educational Psychology, 93, 187-198.
Mayer, R. E., Sobko, K., & Mautone, P. D. (2003). Social cues in multimedia learning: Role of speaker’s voice. Journal of Educational Psychology, 95(2), 419-425.
Miller, G. A. (1956). The magical number seven, plus or minus two: Some limits on our capacity for processing information. Psychological Review, 63(2), 81-97.
Moreno, R., & Mayer, R. E. (2000). A coherence effect in multimedia learning: The case for minimizing irrelevant sounds in the design of multimedia instructional messages. Journal of Educational Psychology, 92, 117-125.
Moreno, R., & Mayer, R. (2007). Interactive multimodal learning environments: Special issue on interactive learning environments: Contemporary issues and trends. Educational Psychology Review, 19(3), 309-326.
Paas, F., & Sweller, J. (2022). Implications of cognitive load theory for multimedia learning. In R. E. Mayer & L. Fiorella (Eds.), The Cambridge handbook of multimedia learning (3rd ed., pp. 73-81). Cambridge University Press.
Paivio, A. (1986). Mental representations: A dual-coding approach. Oxford University Press.
Parong, J., & Mayer, R. E. (2021a). Cognitive and affective processes for learning science in immersive virtual reality. Journal of Computer Assisted Learning, 37, 226-241.
Parong, J., & Mayer, R. E. (2021b). Learning about history in immersive virtual reality: Does immersion facilitate learning? Educational Technology Research and Development, 69, 1433-1451.
Piaget, J. (1926). The language and thought of the child. Kegan, Paul, Trench, Trubner and Company.
Pilegard, C., & Mayer, R. E. (2015a). Within-subject and between-subject conceptions of metacomprehension accuracy. Learning and Individual Differences, 41, 54-61.
Pilegard, C., & Mayer, R. E. (2015b). Adding judgments of understanding to the metacognitive toolbox. Learning and Individual Differences, 41, 62-72.
Plass, J. L., Chun, D. M., Mayer, R. E., & Leutner, D. (1998). Supporting visual and verbal learning preferences in a second language multimedia learning environment. Journal of Educational Psychology, 90, 25-36.
Ponce, H. R., Mayer, R. E., Loyola, M. S., Lopez, M., & Mendez, E. E. (2018). When two computersupported learning strategies are better than one: An eye-tracking study. Computers & Education, 125, 376-388.
Schnotz, W. (2022). Integrated model of text and picture comprehension. In R. E. Mayer & L. Fiorella (Eds.), The Cambridge handbook of multimedia learning (3rd ed., pp. 82-99). Cambridge University Press.
Schnotz, W. (2023). Multimedia comprehension. Cambridge University Press.
Stull, A., & Mayer, R. E. (2021). The case for embodied instruction: The instructor as a source of attentional and social cues in video lectures. Journal of Educational Psychology, 113, 1441-1453.
Stull, A., Fiorella, L., & Mayer, R. E. (2018). An eye-tracking analysis of instructor presence in video lectures. Computers in Human Behavior, 88, 263-272.
Sweller, J. (1999). Instructional design in technical areas. ACER Press.
Sweller, J., Ayres, P., & Kalyuga, S. (2011). Cognitive load theory. Springer.
Sweller, J. (in press). The development of cognitive load theory: Replication crises and incorporation of other theories can lead to theory expansion. Educational Psychology Review.
Vygotsky, L. S. (1978). Mind in society. Harvard University Press.
Wertheimer, M. (1959). Productive thinking. Harper & Row.
Wittrock, M. C. (1974). Learning as a generative activity. Educational Psychologist, 11, 87-95.
Wittrock, M. C. (1989). Generative processes of comprehension. Educational Psychologist, 24, 345-376.
Publisher’s Note Springer Nature remains neutral with regard to jurisdictional claims in published maps and institutional affiliations.

  1. This article is part of the Topical Collection on Theory Development in Educational Psychology.
    Richard E. Mayer
    mayer@psych.ucsb.edu
    1 University of California, Santa Barbara, CA, USA