【直播回放】當心理學遇上AI:新時代心理測量革命在線揭秘_評估_研究_人工智能
直播回放
當心理學遇上AI:
新時代心理測量革命在線揭秘
AI心理測量革新工作坊·重磅來襲
主講專家
姜力銘
北京師範大學心理學部博士,現為微軟亞洲研究院博士後研究員,專注於心理測評與人工智能交叉領域研究。
屠焯然
北京師範大學心理學部博士,從事人工智能技術與心理測量學相結合相關研究。
直播回顧
本次直播兩位主講人向大眾介紹了大會工作坊:人工智能時代的心理測量革新工作坊,並分別詳細講解了7個工作坊的主講內容、方式、數據以及將會帶給大家的研究方法革新啟示。
直播也介紹了工作坊時間地點安排,提供了課程選擇建議,並解答了現場觀眾的問題。
回放方式
微信視頻號|
北師大心理學部EDP中心
掃描視頻號,選擇直播回放
(北師大心理學部培訓中心)
工作坊簡介
本次人工智能時代的心理測量革新工作坊匯聚全球7位頂尖專家,精心打造連接傳統心理測量學與人工智能技術的跨學科對話平臺。
詳細招生簡章請點擊鏈接:
01
人工智能評估:範式與技術
課程簡介:
要實現本世紀對智能系統的期望,我們亟需融合自然智能與人工智能評估領域中的先進理念與方法。本次課程將從這一宏觀視角出發,系統介紹當前人工智能評估的最新進展,涵蓋多個主要的評估範式與研究傳統,包括:TEVV(測試、評估、驗證與確認)體系、準測試流派、evals 社群、建構導向評估體系、現實影響導向評估路徑,以及探索式評估方法等。我們將重點探討建構導向評估如何更有效地借鑒心理測量學、認知心理學和行為科學的理論,深入理解“能力”本身的含義及其測量方式,而不僅僅是性能表現。同時,我們也將分析為何以人類或AI群體為基礎的評估可能存在偏差,並介紹可能的替代方案。最後,我們將人工智能評估視為對系統可預測性的研究:從“整體是否準確或安全”延伸到“在特定使用條件下是否可靠”。當我們將AI評估理解為對解釋力與預測力的雙重追求時,將為該領域帶來新的研究挑戰與機遇。
主講人:何塞·埃爾南德斯奧拉洛
西班牙瓦倫西亞理工大學教授;
研究領域:人工智能、機器學習、數據科學和智能測量等人工智能的能力、普遍性、進步、影響和風險分析。
02
人工智能時代的創造力評估:
心理測量與計算方法
課程簡介:
本工作坊將介紹創造力評估領域的前沿方法,結合心理測量學與人工智能(AI)技術,探索更加高效、科學的評估路徑。工作坊開始將聚焦於評分設計中的核心挑戰,介紹如何通過平衡不完全區組設計提升評分效率。隨後,講解如何運用多層面Rasch模型(Many-Facet Rasch Model, MFRM),對評分者的嚴苛程度、偏差及評分一致性進行建模與校正。工作坊後半部分將轉向探討自動化評分,重點展示如何運用AI,特別是大型語言模型,對創造性作答進行評估。同時,還將演示如何結合MFRM模型,對比並分析人類評分與AI評分之間的一致性與差異。本工作坊將配套提供相關的R語言代碼,幫助參與者動手實踐所學方法,掌握具備大規模應用潛力、具有良好效度與信度的創造力評估工具。
主講人:裡卡多·普瑞米博士
巴西坎皮納斯市聖弗朗西斯科大學副教授;
研究領域:心理測量學、數據科學、人格評估、創造力、智力、情商和人工智能在心理評估中的應用。
03
計算機多階段測驗及其應用
課程簡介:
本次工作坊將系統介紹計算機多階段測驗(Multistage Testing, MST)的基本原理、設計理念及其實施流程。課程內容包括MST設計的背景與必要性、其與傳統線性測驗和計算機自適應測驗(CAT)的區別、運行機制、建模方法及仿真策略等。我們還將介紹MST中的替代評分與估計方法、分類測驗設計、路徑與評分機制、量表鏈接策略、測驗安全保障措施等,並演示相關軟件的操作流程。工作坊內容基於 Yan、von Davier 與 Lewis(2014)主編的專著,結構上涵蓋從測驗設計到實施及事後分析的完整流程,旨在幫助參與者全面了解MST在實際測評中的應用潛力與技術細節。
主講人:顏端麗博士
美國教育考試服務中心數據分析與計算研究主任;
研究領域:心理測量、教育評估與人工智能驅動的測評技術(如自適應測試、自動評分、認知建模等)。
04
利用人工智能優化創造力評估
課程簡介:
本工作坊將探討如何運用不同形式的人工智能(AI)提升創造力評估的適用性和實用性。目前,在心理學領域中,具有良好效度與信度的創造力評估工具往往存在使用效率低、人工成本高、費用昂貴等問題。因此,許多研究者轉而選擇使用較不魯棒的評估方式(例如自我報告量表)。這些問題也導致創造力評估工具難以為一線用戶(如學校教師)所採用。然而,近期已有研究開始探索如何利用AI來解決這些難題。本工作坊將介紹多種通過AI提升創造力評估適用性的路徑,包括運用機器學習模型評估語言與圖形創造力,借助無代碼或低代碼工具輔助開發機器學習模型,以及利用大型語言模型輔助進行創造力評估。本工作坊將著重探討如何開發無需具備特殊編程技能即可使用的AI創造力評估工具,以提高其實用性與可推廣性。
主講人:大衛·克羅普利博士
南澳大利亞大學教授;
研究領域:變革力,創造力,工程學。
05
心理學中監督式機器學習
課程簡介:
近年來,(監督式)機器學習在心理學及其他社會科學領域受到廣泛關注。儘管機器學習在預測能力方面展現出巨大潛力,其實際應用仍面臨諸多挑戰,研究者需對模型進行合理評估,以避免對其性能產生過於樂觀的估計。本工作坊將介紹監督式機器學習建模的基本概念、常見誤區、核心算法,以及其在心理學評估等領域的實際應用。具體內容包括:多種重采樣策略、超參數調優的基本方法、適用於表格數據的基於樹的監督學習算法,以及分類與回歸任務中常用的性能評估指標。此外,還將簡要介紹mlr3生態系統--這是一個在R語言中廣泛應用的機器學習分析工具箱。
主講人:大衛·格瑞茲克博士
烏得勒支大學助理教授;
研究領域:心理測量學和潛在變量建模與計算統計學的整合,包括數據科學技術、優化和統計學習。
06
項目反應理論:
從核心概念到實際應用
課程簡介:
本互動式工作坊將系統介紹項目反應理論(Item Response Theory,IRT)的核心概念,這是一種用於分析測評數據、衡量潛在心理特質(如能力水平)的現代統計方法。工作坊面向初次接觸IRT的研究人員與實踐者,內容涵蓋項目反應與潛變量之間的關係,以及該理論所依據的關鍵假設,如單維性與局部獨立性。參與者將學習幾種常用的IRT模型,包括用於二分類項目的Rasch模型、兩參數邏輯模型(2PL)與三參數邏輯模型(3PL),以及適用於多分類項目的相關模型。工作坊還將介紹IRT的實際應用,包括項目分析、測驗信息函數和評分方法,特別強調對模型輸出的解讀及其在教育與社會科學中的實際運用。本工作坊無需相關背景知識,歡迎對該領域感興趣的參與者積極參與。
主講人:孔瓦尼·穆霍戈博士
劍橋大學心理測量中心心理測量學家;
研究領域:心理測量分析,國家參考測試,電子評估,問卷與研究工具評估。
07
心理測量學中的生成式人工智能
課程簡介:
本工作坊探討生成式人工智能(GenAI)在心理測量學中的當下及未來角色。內容將圍繞以下幾個核心板塊展開:
·大語言模型的工作原理
簡要探究生成式人工智能模型如何學習模式、進行微調並與人類反饋保持一致。
·頭腦風暴:人工智能可在哪些領域革新測試?
·小組活動:兩人一組,尋找在工作流程中應用人工智能的機會。
·人工智能生成的測試題目
對比“傳統”自動項目編寫(模板/規則)與基於人工智能的方法。
·小組活動:為一個新特質生成並點評人工智能製作的問題,隨後展開討論。
·人工智能評分的essays(注:此處“essays”結合語境或指開放式心理測試文本)
對比“傳統”自動評分(簡單評分標準/基礎統計模型)與大語言模型驅動的工具。初步介紹我們利用大語言模型為心理特質生成評分的最新成果。
主講人:喬·沃森博士
劍橋大學心理測量中心心理測量學家;
研究領域:教育與社會影響領域的量化研究與心理測量;運用數據挖掘、自然語言處理與數據可視化技術,開展法律分析、教育政策研究及社交媒體研究。
課程安排
你可能感興趣的
- 跟著誰學心理咨詢好?心理咨詢師培訓班哪家好?推薦靠譜的機構_專業_來訪者_知識
- 2025年事業運勢最佳星座解析職場順遂的生肖星盤預測_職業_八字_太歲
- 2025年7月8日午時出生女性的流年運勢測試——之定Ai_有關_吉象_表象
- 揭秘星座密碼:這三大星座,嘴上甜如蜜,內心狠如狼,城府不可測_交往_雙子座_天蠍座
- 心理話|你經常面對語言暴力嗎——這會對我們的大腦造成不可逆的傷害!_孩子_父母_琪琪
- 2018年1月13日午時出生的男性流年運勢測試——之定Ai_有關_吉象_表象
- 心理問題全息圖:從情緒淤積到認知偏差的真相_dhg_http_store
- 青少年心理咨詢哪裡好,國內兒童心理在線咨詢哪裡有名_小林_社交_剎車片
- 2025年7月8日這天適合做心理咨詢嗎?——之定Ai_情緒_狀態_生活節奏
- 教育部關注心理健康!社會心理服務人才崗位評價考試如何報名?_工作_職業