![]() |
歡迎進入中國休閑研究網站Welcome to the Website of Chinese Leisure Studies |
閱讀與點評(二)2025年1月25-2025年2月25日抽驗方法說明:抽檢式、隨機性、參考同類型、尊重科學精神、尊重知識版權 評價標準:選題新穎、文理兼?zhèn)洹⒅R性與趣味性、啟蒙啟發(fā)與啟智、語言通俗易懂、思想與方法、原創(chuàng)性、跨學科性等。 1)機器人大升級?像人類一樣推理,“拿捏”任意家庭用品! 上傳時間:2025-2-24 學術頭條 AI 機器人 推理(點評:本文介紹了Figure AI 發(fā)布的首個通用視覺-語言-行動(VLA)模型——Helix,這項技術的研發(fā)特色是讓AI能像人類一樣推理,將感知、語言理解和學習控制融為一體,并通過自然語言直接控制人形機器人整個上半身。在 Helix 中,新技能可以用語言即時指定。在這項研究中,Helix 展現出了訓練效率高且僅需要單一權重集的特點。這種收集規(guī)模與現代的單任務模仿學習數據集更相近。盡管對數據的要求相對較低,但 Helix 仍能擴展到更具挑戰(zhàn)性的上半身人形控制動作空間,并提供高速率、高維度的輸出,Helix 能在各種容器中拾取和放置物品,操作抽屜和冰箱,協調靈巧的多機器人交接,并操控數千種新奇物品。文章的署名:學術君。讀過之后還是有收獲。但我個人覺得,這不過是“AI大展宏圖”中的一朵“浪花”。現在的技術幾乎是“時新日異”,甚至可以“秒讀”。如果作者能做些技術前沿的比較研究和展望也許更有價值。另外,本文是拷貝https://www.figure.ai/news/helix,February 20, 2025網站的文章。但是作者沒有做出說明。讀者不得不自己查閱,原來這是一家美國專注于構建AI賦能仿人機器人的公司,總部位于加州桑尼維爾(Sunnyvale)。由此看到,此文不夠嚴謹與規(guī)范,這會讓讀者聯想到作者投機取巧。) 2)用DeepSeek做科研靠譜嗎?科研人員:相當于博士水平,搭框架、寫代碼不在話下 2025-2-19 浙江省科學技術協會 原創(chuàng) AI 科研 人工智能 DeepSeek(點評:DeepSeek是乙巳年伊始最熱門的話題。我已經用它做過實驗。其實如同讀《哈姆雷特》一樣,一千個讀者有一千個不同的理解。這項AI技術在某些方面的確可以協助我們做些事,比如,英譯中的翻譯能力較強,提高了勞動者的效率;查找資料、為論文做出點評(前提是提出有價值的問題)都有一定的能力。然而,問題也是顯而易見的,比如,會提供不夠真實的資料文獻線索,有局限性、機械性、“抖機靈”、張冠李戴、“線路繁忙而中斷回答”等等。毋庸置疑,DeepSeek是靠海量大規(guī)模的數據和計算能力而提高準確度。關鍵問題是“科研人員:相當于博士水平,搭框架、寫代碼不在話下”的標題實在是有一種誤導傾向,難道教人放棄學術研究的獨立思考和獨辟蹊徑?總之,我們應看到DeepSeek利弊共存的兩面性,這也許更符合科學精神。) 3)比爾·蓋茨都喜歡吃的人造肉,它的味道怎么樣?2025-2-18 2024年度科普中國資源薈萃集成示范項目 人造肉(點評:這篇文章圖文并茂,其概念、立論、結構、問題意識、數據、討論與結論都比較耐讀。遺憾的是一周過去只有26位讀者,也耐人尋味。中國人對“人造肉”是不喜歡,不了解,非天然,價格高、不環(huán)保、工藝復雜等因素影響了大眾對它的“親近”和“接受?比爾蓋茨喜歡,我們也需要喜歡嗎?我覺得這方面更值得關注和追蹤研究,以及傳播相應的文章。不過,我覺得文章還是不錯。) 4)DeepSeek新模型有何亮點?專家:真正意義上讓AI像人一樣思考 2025-2-13 浙江省科學技術協會 原創(chuàng) 人工智能 前沿科技 大模型 DeepSeek(點評:本文介紹了DeepSeek的升級版,指出對此前存在的一些問題做了技術“微調”。正如有評論者所留下的感言:“DeepSeek新模型憑借其在技術架構、學習能力、語義理解、推理決策以及情感感知與表達等多方面的亮點,真正開啟了AI像人一樣思考的新時代。它的出現不僅為人工智能領域帶來了新的突破和發(fā)展方向,也將在眾多行業(yè)和領域中發(fā)揮巨大的作用,為人類社會的進步和發(fā)展帶來深遠影響。隨著技術的不斷完善和創(chuàng)新,我們有理由相信,DeepSeek新模型以及類似的人工智能技術將在未來創(chuàng)造更多的奇跡,讓我們的生活變得更加美好。”我作為一名技術理性學者,卻覺得我們在推進技術極快速度迭代的背景下,更應該重視人的存在價值。如果AI將來能替代人做出‘真正意義上讓AI像人一樣思考’的結果,人的前景是什么?對此我們必須有足夠的警覺。而“真正開啟了AI像人一樣思考的新時代”這個結論,不敢茍同。) 5) 我們用最近很火的DeepSeek挑戰(zhàn)了物理所出的競賽題,結果……2025-2-7科普中國AI 推理 奧賽 DeepSeek挑戰(zhàn)了物理所出的競賽題,結果 (點評:這篇文章的題目帶有“懸念”,“DeepSeek挑戰(zhàn)了物理所出的競賽題,結果……”增強了讀者的求知欲,覺得一睹為快。在我看來,這也算對DeepSeek能力的考驗和檢驗。其結果:“首先是 AI 的思路是真的好,基本上沒有無法下手的題,甚至很多時候一下子就能找到正確的思路。但跟人類不同的是,它們在有正確的思路后,會在一些很簡單的錯誤里面打轉。比如……但是 R1 似乎是在反復的猜測和試錯,到最后也沒有得到簡正坐標的表達式。還有就是所有的 AI 似乎都不理解一個“嚴密”的證明究竟意味著怎樣的要求,似乎認為能在形式上湊出答案,就算是證明了。AI 如同人類,也會出現許多“偶然”錯誤。……我們私下嘗試過多次,很多時候 Claude-sonnet 可以正確解出第一題的答案,但正式測試的那次它就偏偏做錯了。出于嚴謹,我們也許應該對同一道題測試多次然后取平均,但實在是有點麻煩……”。這篇文章用實證,為DeepSeek“揭了短”。無論如何,在強大的科技創(chuàng)新和偉業(yè)頻出的背景下,不能盲目跟風,需要保持必要的冷靜、客觀和獨立意識。) 6)從中國文化視角解析大模型訓練之道:以DeepSeek為例 2025-2-5 張藝暢 原創(chuàng) 人工智能 數據采集 大模型訓練 DeepSeek(點評:本文從數據收集、模型預訓練、微調優(yōu)化等關鍵環(huán)節(jié),結合中華傳統文化中的哲學思想,揭示大模型訓練過程中蘊含的文化密碼,突破了僅限于技術解讀的視野,添加了中華傳統文化中的哲學思想給DeepSeek“喂料”。因此,作者說“通過強化學習從人類反饋(RLHF),建立包含50萬條標注數據的道德評估體系。在敏感話題處理上,模型展現出"發(fā)而皆中節(jié)"的審慎態(tài)度,有害內容拒絕率高達98.6%。文化適配方面,開發(fā)"文化感知"模塊,使模型對傳統節(jié)俗的理解準確度達到92%,在古詩詞意象解析任務中超越人類平均水平。”對此“結論”(或是評價),其他方面,我沒有做過實驗,無法肯定或否定。但在對“古詩詞意象解析任務中超越人類平均水平”的說法,我有異議,即夸大了人工智能的能力。我覺得作者對古詩詞與人的關系理解得不夠深刻。在我的理解和個人體驗中,“詩為心聲”,“詩言志”、“詩傳神”等等是人的心神、境遇、情感、靈性等“巧遇”在一起的產物。我相信,無論什么時候,人工智能也無法把一首詩詞做出精妙的理解,只不過是抖抖機靈而已。至于創(chuàng)造出所謂“詩作”,可以說一眼就能識破。因為這種詩作乍一看很美,甚至精致,但是不溫暖,是“鋼鐵”傳遞的“熱”。在DeepSeek大流行中,盡量不炒作,不添油加醋。) 7)讓AI自發(fā)推理!引發(fā)熱議的“DeepSeek”到底是個啥?2025-01-29 AI 人工智能 股票 DeepSeek 科普中國(點評:本文是介紹DeepSeek橫空出世后最早的文章之一。介紹了這項技術的主要特點:“采用了完全開源策略,不僅降低了用戶的使用門檻,還促進了AI開發(fā)者社區(qū)的協作生態(tài)。通過開源,DeepSeek吸引了大量開發(fā)者和研究人員的關注,推動了AI技術的發(fā)展。英偉達AI科學家Jim Fan稱贊DeepSeek是‘真正開放的前沿研究,賦能所有人’”。作者也介紹了“開源也面臨著保護知識產權和開源社區(qū)秩序維護等挑戰(zhàn),比如開源項目擁有的版權,開源與閉源之爭,在特定場景和時代背景下的有效性對比”等問題。作者最后也指出:“從整個AI大模型產業(yè)來看,DeepSeek的成功或許代表了一種全新的發(fā)展方向——通過算法優(yōu)化而非單純依賴算力和數據量來提升模型性能。這一方向也為AI大模型產業(yè)的發(fā)展提供了新的思路。”這篇文章是基于央視新聞、中央廣電總臺中國之聲、新華社等新聞媒體的報導內容整理而成的,且在乙巳年春節(jié)的第二天,反應速度快,報導也中規(guī)中矩。) 本期總體評價及感言: 本月《前沿》欄目關于介紹DeepSeek的文章占比較多,說明“科普中國”的迅捷性、敏銳性和責任感,尤其是在中國最重要的傳統佳節(jié)期間。 本期點評的七篇文章中六篇涉及DeepSeek。多篇文章是專業(yè)技術性的介紹,對于了解中國AI技術創(chuàng)新做了多方位與多領域的介紹。對公眾盡快接觸這項成果大有裨益。 存在的問題與建議: 1)多篇介紹文章有相似和雷同。主要以專業(yè)技術為主,缺少各個篇章中的遞進關系。說明對這一人工智能創(chuàng)新的理解和傳播構架沒來得及設計。情有可原是在春節(jié)期間。 2)幾乎所有的文章都表達出“技術萬能”的傾向,缺少人文視角的學術關懷和人文情懷。如何引導和啟迪技術創(chuàng)新者、文章寫作者、閱讀者,以正確和理智的態(tài)度看待人與人工智能的關系;人工智能的最終目的;人在未來將何去何從;人工智能的風險與挑戰(zhàn);科技倫理如何得到普及等等問題基本沒有涉及,有點遺憾。 3)人工智能,目前是世界各國科技研發(fā)的“高地”,每天幾乎都有新的“創(chuàng)新”成果問世。基于這樣的背景,我們是否可以組織真正的科普專家做些中外成果的對比研究,因為,沒比較,就沒鑒別。要不然妄自尊大,要不然妄自菲薄,要不然霧里看花,要不然自以為是。促進進步需要橫向與縱向的比較。既要引導公眾學會欣賞科技的最新成果,也要引導公眾正確判斷一項技術成果的可信度、可識別度。 4)個別文章作者寫作不夠嚴謹,比如:“據最新資料……”應當給出最新資料的來源、時間、地點、人物等信息。這些是新聞稿的基本要素。題目仍有嘩眾取寵之嫌,有的文章沒有審定人,都不夠嚴肅。另外,“用DeepSeek做科研靠譜嗎?科研人員:相當于博士水平,搭框架、寫代碼不在話下”的題目有誤導之嫌,不甚嚴肅,不符合科學傳播的要義,特別是由省科協級別發(fā)表,其誤導性更強。這些問題的出現說明“科普中國”篩選文章過程把關不嚴。亟待改進! 5)大多文章都是“二手資料”,如何署名?如何保護原創(chuàng)者(或首發(fā)者的版權)是“科普中國”需要思考和做出合理的要求。這個問題還比較突出,直接挑戰(zhàn)科學精神的原則。 以上點評和建議僅供參考。 馬惠娣(2025年2月25日) |
|
江阴市| 邵东县| 彰化市| 睢宁县| 金昌市| 乳山市| 桂东县| 会泽县| 辉县市| 刚察县| 长兴县| 镇平县| 冷水江市| 临安市| 方城县| 延津县| 昌邑市| 莒南县| 阿拉善左旗| 静海县| 临猗县| 呼玛县| 涟水县| 山西省| 阿合奇县| 拉孜县| 驻马店市| 正宁县| 宾阳县| 洮南市| 太谷县| 澜沧| 孝感市| 蒙阴县| 岳西县| 夏河县| 额尔古纳市| 焉耆| 鹤壁市| 洛隆县| 眉山市|