當前位置：香港算命王 > 百科 > 心理測試 > 【直播回放】當心理學遇上AI：新時代心理測量革命在線揭秘_評估_研究_人工智能

【直播回放】當心理學遇上AI：新時代心理測量革命在線揭秘_評估_研究_人工智能

時間：2025-07-06 04:00:51 來源：香港算命王關鍵詞：方法,创造力,评分,心理学,革命,人工智能,测量,在线,研究,评估,创造力,模型,人工智能,工作坊,心理

直播回放

當心理學遇上AI：

新時代心理測量革命在線揭秘

AI心理測量革新工作坊·重磅來襲

主講專家

姜力銘

北京師範大學心理學部博士，現為微軟亞洲研究院博士後研究員，專注於心理測評與人工智能交叉領域研究。

屠焯然

北京師範大學心理學部博士，從事人工智能技術與心理測量學相結合相關研究。

直播回顧

本次直播兩位主講人向大眾介紹了大會工作坊：人工智能時代的心理測量革新工作坊，並分別詳細講解了7個工作坊的主講內容、方式、數據以及將會帶給大家的研究方法革新啟示。

直播也介紹了工作坊時間地點安排，提供了課程選擇建議，並解答了現場觀眾的問題。

回放方式

微信視頻號｜

北師大心理學部EDP中心

掃描視頻號，選擇直播回放

（北師大心理學部培訓中心）

工作坊簡介

本次人工智能時代的心理測量革新工作坊匯聚全球7位頂尖專家，精心打造連接傳統心理測量學與人工智能技術的跨學科對話平臺。

詳細招生簡章請點擊鏈接：

人工智能評估：範式與技術

課程簡介：

要實現本世紀對智能系統的期望，我們亟需融合自然智能與人工智能評估領域中的先進理念與方法。本次課程將從這一宏觀視角出發，系統介紹當前人工智能評估的最新進展，涵蓋多個主要的評估範式與研究傳統，包括：TEVV（測試、評估、驗證與確認）體系、準測試流派、evals 社群、建構導向評估體系、現實影響導向評估路徑，以及探索式評估方法等。我們將重點探討建構導向評估如何更有效地借鑒心理測量學、認知心理學和行為科學的理論，深入理解“能力”本身的含義及其測量方式，而不僅僅是性能表現。同時，我們也將分析為何以人類或AI群體為基礎的評估可能存在偏差，並介紹可能的替代方案。最後，我們將人工智能評估視為對系統可預測性的研究：從“整體是否準確或安全”延伸到“在特定使用條件下是否可靠”。當我們將AI評估理解為對解釋力與預測力的雙重追求時，將為該領域帶來新的研究挑戰與機遇。

主講人：何塞·埃爾南德斯奧拉洛

西班牙瓦倫西亞理工大學教授；

研究領域:人工智能、機器學習、數據科學和智能測量等人工智能的能力、普遍性、進步、影響和風險分析。

人工智能時代的創造力評估：

心理測量與計算方法

課程簡介：

本工作坊將介紹創造力評估領域的前沿方法，結合心理測量學與人工智能（AI）技術，探索更加高效、科學的評估路徑。工作坊開始將聚焦於評分設計中的核心挑戰，介紹如何通過平衡不完全區組設計提升評分效率。隨後，講解如何運用多層面Rasch模型（Many-Facet Rasch Model, MFRM），對評分者的嚴苛程度、偏差及評分一致性進行建模與校正。工作坊後半部分將轉向探討自動化評分，重點展示如何運用AI，特別是大型語言模型，對創造性作答進行評估。同時，還將演示如何結合MFRM模型，對比並分析人類評分與AI評分之間的一致性與差異。本工作坊將配套提供相關的R語言代碼，幫助參與者動手實踐所學方法，掌握具備大規模應用潛力、具有良好效度與信度的創造力評估工具。

主講人：裡卡多·普瑞米博士

巴西坎皮納斯市聖弗朗西斯科大學副教授；

研究領域：心理測量學、數據科學、人格評估、創造力、智力、情商和人工智能在心理評估中的應用。

計算機多階段測驗及其應用

課程簡介：

本次工作坊將系統介紹計算機多階段測驗（Multistage Testing, MST）的基本原理、設計理念及其實施流程。課程內容包括MST設計的背景與必要性、其與傳統線性測驗和計算機自適應測驗（CAT）的區別、運行機制、建模方法及仿真策略等。我們還將介紹MST中的替代評分與估計方法、分類測驗設計、路徑與評分機制、量表鏈接策略、測驗安全保障措施等，並演示相關軟件的操作流程。工作坊內容基於 Yan、von Davier 與 Lewis（2014）主編的專著，結構上涵蓋從測驗設計到實施及事後分析的完整流程，旨在幫助參與者全面了解MST在實際測評中的應用潛力與技術細節。

主講人：顏端麗博士

美國教育考試服務中心數據分析與計算研究主任；

研究領域：心理測量、教育評估與人工智能驅動的測評技術（如自適應測試、自動評分、認知建模等）。

利用人工智能優化創造力評估

課程簡介：

本工作坊將探討如何運用不同形式的人工智能（AI）提升創造力評估的適用性和實用性。目前，在心理學領域中，具有良好效度與信度的創造力評估工具往往存在使用效率低、人工成本高、費用昂貴等問題。因此，許多研究者轉而選擇使用較不魯棒的評估方式（例如自我報告量表）。這些問題也導致創造力評估工具難以為一線用戶（如學校教師）所採用。然而，近期已有研究開始探索如何利用AI來解決這些難題。本工作坊將介紹多種通過AI提升創造力評估適用性的路徑，包括運用機器學習模型評估語言與圖形創造力，借助無代碼或低代碼工具輔助開發機器學習模型，以及利用大型語言模型輔助進行創造力評估。本工作坊將著重探討如何開發無需具備特殊編程技能即可使用的AI創造力評估工具，以提高其實用性與可推廣性。

主講人：大衛·克羅普利博士

南澳大利亞大學教授；

研究領域：變革力，創造力，工程學。

心理學中監督式機器學習

課程簡介：

近年來，（監督式）機器學習在心理學及其他社會科學領域受到廣泛關注。儘管機器學習在預測能力方面展現出巨大潛力，其實際應用仍面臨諸多挑戰，研究者需對模型進行合理評估，以避免對其性能產生過於樂觀的估計。本工作坊將介紹監督式機器學習建模的基本概念、常見誤區、核心算法，以及其在心理學評估等領域的實際應用。具體內容包括：多種重采樣策略、超參數調優的基本方法、適用於表格數據的基於樹的監督學習算法，以及分類與回歸任務中常用的性能評估指標。此外，還將簡要介紹mlr3生態系統--這是一個在R語言中廣泛應用的機器學習分析工具箱。

主講人：大衛·格瑞茲克博士

烏得勒支大學助理教授；

研究領域：心理測量學和潛在變量建模與計算統計學的整合，包括數據科學技術、優化和統計學習。

項目反應理論：

從核心概念到實際應用

課程簡介：

本互動式工作坊將系統介紹項目反應理論（Item Response Theory,IRT）的核心概念，這是一種用於分析測評數據、衡量潛在心理特質（如能力水平）的現代統計方法。工作坊面向初次接觸IRT的研究人員與實踐者，內容涵蓋項目反應與潛變量之間的關係，以及該理論所依據的關鍵假設，如單維性與局部獨立性。參與者將學習幾種常用的IRT模型，包括用於二分類項目的Rasch模型、兩參數邏輯模型（2PL）與三參數邏輯模型（3PL），以及適用於多分類項目的相關模型。工作坊還將介紹IRT的實際應用，包括項目分析、測驗信息函數和評分方法，特別強調對模型輸出的解讀及其在教育與社會科學中的實際運用。本工作坊無需相關背景知識，歡迎對該領域感興趣的參與者積極參與。