歡迎進入中國休閑研究網站

Welcome to the Website of Chinese Leisure Studies

閱讀與點評（二）

2025年1月25-2025年2月25日

抽驗方法說明：抽檢式、隨機性、參考同類型、尊重科學精神、尊重知識版權

評價標準：選題新穎、文理兼?zhèn)洹⒅R性與趣味性、啟蒙啟發(fā)與啟智、語言通俗易懂、思想與方法、原創(chuàng)性、跨學科性等。

1）機器人大升級？像人類一樣推理，“拿捏”任意家庭用品！上傳時間：2025-2-24 學術頭條 AI 機器人推理（點評：本文介紹了Figure AI 發(fā)布的首個通用視覺-語言-行動（VLA）模型——Helix，這項技術的研發(fā)特色是讓AI能像人類一樣推理，將感知、語言理解和學習控制融為一體，并通過自然語言直接控制人形機器人整個上半身。在 Helix 中，新技能可以用語言即時指定。在這項研究中，Helix 展現出了訓練效率高且僅需要單一權重集的特點。這種收集規(guī)模與現代的單任務模仿學習數據集更相近。盡管對數據的要求相對較低，但 Helix 仍能擴展到更具挑戰(zhàn)性的上半身人形控制動作空間，并提供高速率、高維度的輸出，Helix 能在各種容器中拾取和放置物品，操作抽屜和冰箱，協調靈巧的多機器人交接，并操控數千種新奇物品。文章的署名：學術君。讀過之后還是有收獲。但我個人覺得，這不過是“AI大展宏圖”中的一朵“浪花”。現在的技術幾乎是“時新日異”，甚至可以“秒讀”。如果作者能做些技術前沿的比較研究和展望也許更有價值。另外，本文是拷貝https://www.figure.ai/news/helix，February 20, 2025網站的文章。但是作者沒有做出說明。讀者不得不自己查閱，原來這是一家美國專注于構建AI賦能仿人機器人的公司，總部位于加州桑尼維爾（Sunnyvale）。由此看到，此文不夠嚴謹與規(guī)范，這會讓讀者聯想到作者投機取巧。）

2）用DeepSeek做科研靠譜嗎？科研人員：相當于博士水平，搭框架、寫代碼不在話下 2025-2-19 浙江省科學技術協會原創(chuàng) AI 科研人工智能 DeepSeek（點評：DeepSeek是乙巳年伊始最熱門的話題。我已經用它做過實驗。其實如同讀《哈姆雷特》一樣，一千個讀者有一千個不同的理解。這項AI技術在某些方面的確可以協助我們做些事，比如，英譯中的翻譯能力較強，提高了勞動者的效率；查找資料、為論文做出點評（前提是提出有價值的問題）都有一定的能力。然而，問題也是顯而易見的，比如，會提供不夠真實的資料文獻線索，有局限性、機械性、“抖機靈”、張冠李戴、“線路繁忙而中斷回答”等等。毋庸置疑，DeepSeek是靠海量大規(guī)模的數據和計算能力而提高準確度。關鍵問題是“科研人員：相當于博士水平，搭框架、寫代碼不在話下”的標題實在是有一種誤導傾向，難道教人放棄學術研究的獨立思考和獨辟蹊徑？總之，我們應看到DeepSeek利弊共存的兩面性，這也許更符合科學精神。）

3）比爾·蓋茨都喜歡吃的人造肉,它的味道怎么樣？2025-2-18 2024年度科普中國資源薈萃集成示范項目人造肉（點評：這篇文章圖文并茂，其概念、立論、結構、問題意識、數據、討論與結論都比較耐讀。遺憾的是一周過去只有26位讀者，也耐人尋味。中國人對“人造肉”是不喜歡，不了解，非天然，價格高、不環(huán)保、工藝復雜等因素影響了大眾對它的“親近”和“接受？比爾蓋茨喜歡，我們也需要喜歡嗎？我覺得這方面更值得關注和追蹤研究，以及傳播相應的文章。不過，我覺得文章還是不錯。）

4）DeepSeek新模型有何亮點？專家：真正意義上讓AI像人一樣思考 2025-2-13 浙江省科學技術協會原創(chuàng) 人工智能前沿科技大模型 DeepSeek（點評：本文介紹了DeepSeek的升級版，指出對此前存在的一些問題做了技術“微調”。正如有評論者所留下的感言：“DeepSeek新模型憑借其在技術架構、學習能力、語義理解、推理決策以及情感感知與表達等多方面的亮點，真正開啟了AI像人一樣思考的新時代。它的出現不僅為人工智能領域帶來了新的突破和發(fā)展方向，也將在眾多行業(yè)和領域中發(fā)揮巨大的作用，為人類社會的進步和發(fā)展帶來深遠影響。隨著技術的不斷完善和創(chuàng)新，我們有理由相信，DeepSeek新模型以及類似的人工智能技術將在未來創(chuàng)造更多的奇跡，讓我們的生活變得更加美好。”我作為一名技術理性學者，卻覺得我們在推進技術極快速度迭代的背景下，更應該重視人的存在價值。如果AI將來能替代人做出‘真正意義上讓AI像人一樣思考’的結果，人的前景是什么？對此我們必須有足夠的警覺。而“真正開啟了AI像人一樣思考的新時代”這個結論，不敢茍同。）

5) 我們用最近很火的DeepSeek挑戰(zhàn)了物理所出的競賽題，結果……2025-2-7科普中國AI 推理奧賽 DeepSeek挑戰(zhàn)了物理所出的競賽題，結果 (點評：這篇文章的題目帶有“懸念”，“DeepSeek挑戰(zhàn)了物理所出的競賽題，結果……”增強了讀者的求知欲，覺得一睹為快。在我看來，這也算對DeepSeek能力的考驗和檢驗。其結果：“首先是 AI 的思路是真的好，基本上沒有無法下手的題，甚至很多時候一下子就能找到正確的思路。但跟人類不同的是，它們在有正確的思路后，會在一些很簡單的錯誤里面打轉。比如……但是 R1 似乎是在反復的猜測和試錯，到最后也沒有得到簡正坐標的表達式。還有就是所有的 AI 似乎都不理解一個“嚴密”的證明究竟意味著怎樣的要求，似乎認為能在形式上湊出答案，就算是證明了。AI 如同人類，也會出現許多“偶然”錯誤。……我們私下嘗試過多次，很多時候 Claude-sonnet 可以正確解出第一題的答案，但正式測試的那次它就偏偏做錯了。出于嚴謹，我們也許應該對同一道題測試多次然后取平均，但實在是有點麻煩……”。這篇文章用實證，為DeepSeek“揭了短”。無論如何，在強大的科技創(chuàng)新和偉業(yè)頻出的背景下，不能盲目跟風，需要保持必要的冷靜、客觀和獨立意識。)

6）從中國文化視角解析大模型訓練之道：以DeepSeek為例 2025-2-5 張藝暢原創(chuàng) 人工智能數據采集大模型訓練 DeepSeek（點評：本文從數據收集、模型預訓練、微調優(yōu)化等關鍵環(huán)節(jié)，結合中華傳統文化中的哲學思想，揭示大模型訓練過程中蘊含的文化密碼，突破了僅限于技術解讀的視野，添加了中華傳統文化中的哲學思想給DeepSeek“喂料”。因此，作者說“通過強化學習從人類反饋（RLHF），建立包含50萬條標注數據的道德評估體系。在敏感話題處理上，模型展現出"發(fā)而皆中節(jié)"的審慎態(tài)度，有害內容拒絕率高達98.6%。文化適配方面，開發(fā)"文化感知"模塊，使模型對傳統節(jié)俗的理解準確度達到92%，在古詩詞意象解析任務中超越人類平均水平。”對此“結論”（或是評價），其他方面，我沒有做過實驗，無法肯定或否定。但在對“古詩詞意象解析任務中超越人類平均水平”的說法，我有異議，即夸大了人工智能的能力。我覺得作者對古詩詞與人的關系理解得不夠深刻。在我的理解和個人體驗中，“詩為心聲”，“詩言志”、“詩傳神”等等是人的心神、境遇、情感、靈性等“巧遇”在一起的產物。我相信，無論什么時候，人工智能也無法把一首詩詞做出精妙的理解，只不過是抖抖機靈而已。至于創(chuàng)造出所謂“詩作”，可以說一眼就能識破。因為這種詩作乍一看很美，甚至精致，但是不溫暖，是“鋼鐵”傳遞的“熱”。在DeepSeek大流行中，盡量不炒作，不添油加醋。）

7）讓AI自發(fā)推理！引發(fā)熱議的“DeepSeek”到底是個啥？2025-01-29 AI 人工智能股票 DeepSeek 科普中國（點評：本文是介紹DeepSeek橫空出世后最早的文章之一。介紹了這項技術的主要特點：“采用了完全開源策略，不僅降低了用戶的使用門檻，還促進了AI開發(fā)者社區(qū)的協作生態(tài)。通過開源，DeepSeek吸引了大量開發(fā)者和研究人員的關注，推動了AI技術的發(fā)展。英偉達AI科學家Jim Fan稱贊DeepSeek是‘真正開放的前沿研究，賦能所有人’”。作者也介紹了“開源也面臨著保護知識產權和開源社區(qū)秩序維護等挑戰(zhàn)，比如開源項目擁有的版權，開源與閉源之爭，在特定場景和時代背景下的有效性對比”等問題。作者最后也指出：“從整個AI大模型產業(yè)來看，DeepSeek的成功或許代表了一種全新的發(fā)展方向——通過算法優(yōu)化而非單純依賴算力和數據量來提升模型性能。這一方向也為AI大模型產業(yè)的發(fā)展提供了新的思路。”這篇文章是基于央視新聞、中央廣電總臺中國之聲、新華社等新聞媒體的報導內容整理而成的，且在乙巳年春節(jié)的第二天，反應速度快，報導也中規(guī)中矩。）

本期總體評價及感言：

本月《前沿》欄目關于介紹DeepSeek的文章占比較多，說明“科普中國”的迅捷性、敏銳性和責任感，尤其是在中國最重要的傳統佳節(jié)期間。

本期點評的七篇文章中六篇涉及DeepSeek。多篇文章是專業(yè)技術性的介紹，對于了解中國AI技術創(chuàng)新做了多方位與多領域的介紹。對公眾盡快接觸這項成果大有裨益。

存在的問題與建議：

1）多篇介紹文章有相似和雷同。主要以專業(yè)技術為主，缺少各個篇章中的遞進關系。說明對這一人工智能創(chuàng)新的理解和傳播構架沒來得及設計。情有可原是在春節(jié)期間。

2）幾乎所有的文章都表達出“技術萬能”的傾向，缺少人文視角的學術關懷和人文情懷。如何引導和啟迪技術創(chuàng)新者、文章寫作者、閱讀者，以正確和理智的態(tài)度看待人與人工智能的關系；人工智能的最終目的；人在未來將何去何從；人工智能的風險與挑戰(zhàn)；科技倫理如何得到普及等等問題基本沒有涉及，有點遺憾。

3）人工智能，目前是世界各國科技研發(fā)的“高地”，每天幾乎都有新的“創(chuàng)新”成果問世。基于這樣的背景，我們是否可以組織真正的科普專家做些中外成果的對比研究，因為，沒比較，就沒鑒別。要不然妄自尊大，要不然妄自菲薄，要不然霧里看花，要不然自以為是。促進進步需要橫向與縱向的比較。既要引導公眾學會欣賞科技的最新成果，也要引導公眾正確判斷一項技術成果的可信度、可識別度。

4）個別文章作者寫作不夠嚴謹，比如：“據最新資料……”應當給出最新資料的來源、時間、地點、人物等信息。這些是新聞稿的基本要素。題目仍有嘩眾取寵之嫌，有的文章沒有審定人，都不夠嚴肅。另外，“用DeepSeek做科研靠譜嗎？科研人員：相當于博士水平，搭框架、寫代碼不在話下”的題目有誤導之嫌，不甚嚴肅，不符合科學傳播的要義，特別是由省科協級別發(fā)表，其誤導性更強。這些問題的出現說明“科普中國”篩選文章過程把關不嚴。亟待改進！

5）大多文章都是“二手資料”，如何署名？如何保護原創(chuàng)者（或首發(fā)者的版權）是“科普中國”需要思考和做出合理的要求。這個問題還比較突出，直接挑戰(zhàn)科學精神的原則。

以上點評和建議僅供參考。

馬惠娣（2025年2月25日）

正阳县| 黔南| 于都县| 阿勒泰市| 通道| 仁化县| 华安县| 淅川县| 屯留县| 金门县| 承德市| 海南省| 通州区| 米易县| 安仁县| 阿荣旗| 台山市| 陇南市| 晋江市| 靖远县| 沛县| 盈江县| 南皮县| 陆丰市| 额济纳旗| 湖南省| 从江县| 连山| 哈密市| 福鼎市| 绥德县| 南皮县| 黔南| 彭阳县| 云霄县| 台北市| 满洲里市| 崇左市| 苍溪县| 兴海县| 福贡县|