跳到主要內容

很遺憾,我們無法支援你的瀏覽器。如果可以,請升級到新版本,或使用 Mozilla Firefox、Microsoft Edge、Google Chrome 或 Safari 14 或更新版本。如果無法升級,而且需要支援,請將你的回饋寄給我們。

我們衷心感謝你對這個新體驗的回饋。告訴我們你的想法(打開新的分頁/視窗)

Elsevier
與我們共同出版
Connect

我們如何利用人工智慧來提高化學研究人員的生產力

2023年2月6日 | 10 最小讀取時間

Eleonora Echegaray

Elsevier Reaxys winner

數據強化專家帶您了解 Elsevier 屢獲殊榮的 Reaxys Content Catalyst 團隊的幕後故事

圖說: Elsevier 團隊因 Reaxys 內容催化劑榮獲數據科學卓越獎(從左到右): Mark Sheehan(Elsevier 生命科學部數據科學副總裁)、Anitha Golla 博士(Elsevier 資深數據強化專家)、Chetan Bhagat(獲獎者、印度作家)和 Abhinav Agnihotry(Elsevier 資料科學家)

全世界的化學研究人員都在使用 Elsevier 的專家編輯化學資訊平台 Reaxys,以查找他們在製藥、化學研發、學術研究和教育等廣泛領域所需的資訊和化合物。 最近,Reaxys 內容催化劑背後的團隊因在分析、數據科學和人工智慧方面的創新而獲得數據科學卓越獎(打開新的分頁/視窗)

我與 Elsevier 的資深資料強化專家 Anitha Golla(打開新的分頁/視窗) 博士坐在一起,討論了她的團隊的工作,以及他們為不斷擴展和更新 Reaxys 中的內容所做的工作。

顯然,她的工作就是她的回報。 但她仍然很高興自己的團隊能與 Axis Bank Limited、IBM、施耐德電機和富國銀行等重量級公司一起獲獎。

"Anitha 說:"如今,每個人都在利用人工智慧和資料科學做一些事情--有太多的工作正在進行中。 "因此,能從更廣泛的人工智慧社群獲得這種認可真是太棒了

Anitha Golla

Anitha Golla, PhD

1 億篇文獻和計數

在印度最大的人工智慧會議 Cypher22(打開新的分頁/視窗)上,印度分析雜誌(打開新的分頁/視窗)於 9 月主辦了第四屆人工智慧獎頒獎典禮。 該獎項表彰了團隊在人工智慧驅動的內容豐富生產管道 Reaxys Content Catalyst(RCC)方面所做的努力,該管道致力於從根本上提高 Reaxys 中的可用內容,進而提高化學研究人員的研發效率。

該獎項還恰逢通過了一個關鍵基準:處理超過 1 億篇論文。

"Anitha 說:"這兩項成就都證明了跨職能團隊的力量。

思維多樣性:跨職能合作

Anitha 在 德國卡爾斯魯厄理工學院(KIT)(打開新的分頁/視窗)攻讀生物有機化學博士學位期間,對在多學科團隊中工作產生了濃厚的興趣:

“我的導師有一家小型新創公司,他的目標是為生物學家的研究提供盡可能多的多肽。這些勝肽必須既便宜又優質。為了幫助實現這個目標,我和所有這些了不起的人一起工作 :物理學家、生物學家、工程師"。

“以前,我基本上是一個孤獨的研究員。 但這次經歷讓我明白,如果你與所有這些不同的人一起工作,神奇的事情就會發生。 而且,與你單獨行動相比,它們會發生得更好、更快。”

高影響力的利基市場

她目前工作的複雜性當然需要一個跨職能的團隊。

“科學界發表了數百萬份論文,它們有能力在各個層面上改變世界,“ 她說。 “這可能是關於一種救命藥物,或是關於改變我們做出決定或應對特定挑戰的方式。 我們的工作是確保這些內容是最新的,以便人們可以以最快、最聰明的方式從那裡獲取它。”

儘管 Anitha 對自己工作的相關性充滿熱情,但她仍然對這個獎項感到驚訝。 “我們實際上相當小眾,”她說。 “我們正在從文字和圖像中收集化學事實,並將它們提供給科學界,以幫助推動他們的決策,並真正幫助他們完成非凡的工作。”

“我們的客戶確實告訴我們他們想要什麼…”

“我們的專案也因完全源自於客戶需求而脫穎而出,“ Anitha 補充道。“我們的客戶毫不誇張地告訴我們他們想要什麼:能夠在過去 20 多年發布的專利中非常快速地找到某些東西——物質、生物目標。 他們想要了解競爭格局,這樣他們就可以在這種格局中工作,而不是對抗。"

“傳統上,只有一種方法可以獲得此類資訊:僱用一支化學家隊伍逐行閱讀數百萬份論文。 但當然,這太慢而且成本太高。 因此,我們尋求實現流程自動化——畢竟,Elsevier 已經將數據科學應用於幾乎所有其他領域。”

沒有平凡的一天

根據工作需要,該專案有一個 40 多人的團隊參與。

"Anitha 解釋說:"在任何一天,我都要與來自三四個不同領域的人合作--鐵桿化學家、資料科學家、資料工程師、資料架構師、軟體人員等等。 "我必須轉換思維,既要像化學家那樣檢查結構是否正確,又要像統計學家那樣研究結構是否精確。這樣才能保持興奮。

她說,這也讓工作充滿挑戰: 她說:"你可能會想出一些對化學家有意義的東西。但當軟體方面的人看到它時,他們會說在計算能力或時間方面成本太高。後來,雖然某些東西可能在小範圍內有效,但當它被生產出來並應用於數百萬份論文時,情況就完全不同了。但最奇妙的是,每個人都希望找到適當的平衡點,讓每個人都滿意。

不斷前進

該計畫從一開始就雄心勃勃。

"Anitha 解釋說:"這不僅僅是一個能夠快速、準確地處理專利的管道。 Anitha 解釋說,"每當有新的東西出現,無論是更多的論文還是新的技術、方法或產品,它都需要更新和升級。它需要是一個完全模組化的傳遞途徑--就像即插即用一樣--可以很容易地被採用並持續運作。因此,這需要大量的規劃工作。

現在,隨著傳遞途徑擴展到期刊數據,所有這些規劃都已見成效。 計畫在 2023 年對基礎架構進行進一步的持續開發,包括擴展到 Elsevier 的生物醫學文獻資料庫 Embase(打開新的分頁/視窗)

我們的雄心壯志仍在繼續。

"Anitha 說:在未來的某一天,我看到了一條任何東西都可以通過的管道,它只是分支到不同的產品。 "得益於 Elsevier 龐大的分類法,它將能夠自行對所有內容進行分類。

"一旦你意識到,從數據的角度來看,在獲得可操作的見解方面,你可以做很多事情,天空就會變得無限廣闊--不僅對化學家和其他生命科學(研究人員)如此, 對其他領域也是如此。

貢獻者