
2024年您產(chǎn)品必備的10大AI API推薦
CT.gov 數(shù)據(jù)庫主要包括以下類型的研究:
注意:不是所有的臨床試驗(yàn)或觀察性研究都會(huì)收錄在 CT.gov 數(shù)據(jù)庫中。美國(guó)的法律、法規(guī)和政策要求申辦方或研究者必須向 CT.gov 提交某些類型的臨床試驗(yàn);只有少數(shù)政策要求將觀察性研究也列入該數(shù)據(jù)庫。對(duì)于法律或政策未明確要求提交的臨床研究,申辦方或研究者可以自主選擇是否將其提交至 CT.gov;但一旦選擇將研究列入 CT.gov,則必須保持該項(xiàng)研究信息的及時(shí)更新并符合相關(guān)信息提交要求。另外,本文延用 “臨床試驗(yàn)數(shù)據(jù)庫” 這一習(xí)慣表述來描述 CT.gov 數(shù)據(jù)庫,盡管現(xiàn)在其適用范圍較最初創(chuàng)立時(shí)要求更廣,包括部分其它類型臨床研究項(xiàng)目等。
關(guān)于 CT.gov 適應(yīng)臨床試驗(yàn)(Applicable Clinical Trial, ACT)
除上述法律明確規(guī)定必必須提交的臨床試驗(yàn)之外,下面兩類型臨床研究也需要在 CT.gov 進(jìn)行提交:
CT.gov 臨床試驗(yàn)主要信息通常一項(xiàng)具體臨床試驗(yàn)提交包括以下關(guān)鍵信息:研究基本信息(研究標(biāo)題、分期、概要、編號(hào)、關(guān)鍵詞等)、研究最新狀態(tài)、研究開始和完成時(shí)間、研究目的、具體干預(yù)措施、參與條件(入排標(biāo)準(zhǔn))、試驗(yàn)設(shè)計(jì)(研究類型)、研究結(jié)果、監(jiān)管信息、申辦方和研究者信息、研究地點(diǎn)、聯(lián)系方式及其它與該項(xiàng)研究相關(guān)的論文或出版物等,上述信息有助于提高臨床試驗(yàn)的透明度、減少或避免重復(fù)性研究。
隨著時(shí)間的推移,法律、規(guī)章和政策的變化可能會(huì)導(dǎo)致具體的信息提交要求發(fā)生變化,但整體趨勢(shì)是朝著更嚴(yán)格的方向演進(jìn),這包括了提交數(shù)據(jù)的內(nèi)容、覆蓋范圍和時(shí)間節(jié)點(diǎn)等方面,這種趨勢(shì)也反映了人們對(duì)臨床試驗(yàn)信息準(zhǔn)確性、完整性和及時(shí)性的日益關(guān)注。
與 CT.gov 信息提交要求變化的主要里程碑事件
注:NIH / NLM 不對(duì)提交的內(nèi)容進(jìn)行科學(xué)性審查,申辦方和研究者應(yīng)對(duì)所提交數(shù)據(jù)的安全性、科學(xué)性和準(zhǔn)確性負(fù)責(zé),并確保其研究符合所有相關(guān)法律法規(guī)。關(guān)于拓展性使用 (Expanded Access)CT.gov 數(shù)據(jù)庫同時(shí)也提供了關(guān)于拓展性使用相關(guān)聯(lián)系信息。拓展性使用,又可稱為同情使用(Compassionate Use),是指在沒有其他治療選擇、且疾病嚴(yán)重或危及生命時(shí),允許未參加臨床試驗(yàn)患者使用該研究藥物或醫(yī)療器械等用于治療,拓展性使用并非適用于所有正在進(jìn)行的臨床試驗(yàn)。CT.gov 提供了相關(guān)聯(lián)系人,供患者必要時(shí)聯(lián)系。FDA 也明確了拓展性使用的相關(guān)規(guī)定和要求(https://www.fda.gov/news-events/public-health-focus/expanded-access)。有關(guān) CT.gov 網(wǎng)站數(shù)據(jù)庫更多詳情介紹,可參考官網(wǎng)(https://clinicaltrials.gov/about-site/about-ctg)查閱。
CT.gov 是一個(gè)開放且免費(fèi)的在線臨床試驗(yàn)數(shù)據(jù)庫,公眾可以輕松訪問和利用其中的數(shù)據(jù)。目前,用戶主要通過兩種方式來下載和使用數(shù)據(jù):手動(dòng)下載和通過 API 自動(dòng)下載。
手動(dòng)下載CT.gov 提供了靈活的手動(dòng)下載功能,允許用戶下載全部數(shù)據(jù)包或僅下載符合特定篩選條件的數(shù)據(jù)。支持的文件格式有Json、CSV、RIS、FHIR 等。建議用戶尤其是統(tǒng)計(jì)編程人員或數(shù)據(jù)科學(xué)工作者,優(yōu)先選擇 JSON 格式,因?yàn)樗С窒螺d所有包含在數(shù)據(jù)庫中的字段信息,但后期也多需要一定的程序來處理。相對(duì)而言,CSV 格式最多只能下載30個(gè)預(yù)設(shè)字段信息,好處是不需要額外的編程技能即可方便快速使用。
API 接口自動(dòng)下載CT.gov 還支持通過 API 接口進(jìn)行程序化自動(dòng)下載,這種方式更加適合需要定期更新數(shù)據(jù)或進(jìn)行大規(guī)模數(shù)據(jù)分析的用戶。API 提供的靈活訪問確保用戶能有效獲取和整合所需數(shù)據(jù)。下面主要介紹如何通過其提供的 API 接口來獲取相關(guān)數(shù)據(jù)信息,有關(guān) API 的基本知識(shí)介紹,可參考前述文章探秘API:解鎖統(tǒng)計(jì)編程新時(shí)代的鑰匙。
CT.gov API 主要采用 GET 請(qǐng)求方式來為用戶提供數(shù)據(jù)交換服務(wù),其主接口地址為 https://clinicaltrials.gov/api/v2/,目前最新版本為 2.0.3, 可通過下面API 地址獲取當(dāng)前 API 最新版本信息:
https://clinicaltrials.gov/api/v2/version
通常,我們使用更多的是與研究項(xiàng)目相關(guān)的 API Endpoints, 主要包括下面 5個(gè):
API Endpoint URL | 用途 |
/studies | 用來獲取符合查詢或過濾條件的單個(gè)或多個(gè)臨床研究項(xiàng)目 |
/studies/{nctId} | 用來獲取某一指定研究編號(hào)的臨床項(xiàng)目信息 |
/studies/metadata | 用來返回?cái)?shù)據(jù)庫表元數(shù)據(jù)信息,如字段名稱、標(biāo)簽、類型等 |
/studies/search-areas | 用來獲取構(gòu)建復(fù)雜查詢的字段及其權(quán)重信息,詳情請(qǐng)參見:https://clinicaltrials.gov/data-api/about-api/search-areas |
/studies/enums | 獲取數(shù)據(jù)庫中所有枚舉類型字段值列表,如研究狀態(tài) RecruitmentStatus 值列表,即下圖。 |
獲取 API 數(shù)據(jù)結(jié)構(gòu)可用字段信息https://clinicaltrials.gov/api/v2/studies/metadata
另外,還有用來獲取數(shù)據(jù)基本統(tǒng)計(jì)信息的3 個(gè) API 接口,包括返回項(xiàng)目 Json 數(shù)據(jù)大小及其分布、字段值基本描述、列表或數(shù)組類型字段值長(zhǎng)度描述及分布等。
比如運(yùn)行 API( https://clinicaltrials.gov/api/v2/stats/field/sizes)將返回下述結(jié)果:
從中我們可以了解字段 Phase 中只包括有一個(gè)值的研究項(xiàng)目共計(jì) 368448 個(gè),包括有兩個(gè)值的項(xiàng)目有 21819 個(gè),比如屬于 Phase I / Phase II 聯(lián)合設(shè)計(jì)的項(xiàng)目。
再通過下面的查詢(為方便閱讀,省略了前面 API 主路徑 https://clinicaltrials.gov/api/v2/studies,下同)可以返回所有 size=2的項(xiàng)目信息, 此處用到了該 API 查詢中的高級(jí)使用方法 Search Area:
?filter.advanced=AREA[Phase:size]2&countTotal=true
可參考官方 API 使用文檔了解更多詳情(https://clinicaltrials.gov/data-api/api)。
上面對(duì) CT.gov 常用 API 接口類型做了基本的描述,接下來,我們通過幾個(gè)具體的查詢實(shí)例來幫助大家更快地熟悉它們的主要用法。下面先以最常用的接口 /studies 為例。
????方法:直接調(diào)用該 API (https://clinicaltrials.gov/api/v2/studies),不帶查詢或過濾條件參數(shù)。
上面是不帶查詢和過濾條件的返回結(jié)果,包括所有記錄和字段數(shù)據(jù),可以看到截止當(dāng)前日期共有 509510 條記錄(注:默認(rèn)返回中不包括 totalCount 值,這里聲明了參數(shù) countTotal 為真以返回該數(shù)據(jù))
?countTotal=true
獲取滿足特定查詢條件的臨床試驗(yàn)信息:
比如,我們想知道羅氏開展的所有臨床試驗(yàn)信息,可通過參數(shù) query.lead 來指定主要申辦方名稱:
?countTotal=true&query.lead=Roche
如只想返回指定字段信息,可以通過參數(shù) fields 來限定返回字段列表清單,比如 (點(diǎn)擊閱讀全文可快速體驗(yàn)該查詢結(jié)果):
fields=NCTId,BriefTitle,Keyword,LeadSponsor,OverallStatus&countTotal=true&query.lead=Roche
分頁查詢:當(dāng) API 返回結(jié)果數(shù)超過 pageSize 設(shè)定(默認(rèn)值為 10)時(shí),會(huì)在返回結(jié)果中包括一個(gè) nextPageToken 的參數(shù)值,供 API 獲取下一頁數(shù)據(jù)時(shí)參數(shù)傳遞時(shí)使用。
調(diào)用時(shí)將該值添加到參數(shù) pageToken 即可返回下一頁數(shù)據(jù):
?pageToken=KV1-7ZuCkPYg&countTotal=true有關(guān)更多查詢參數(shù)設(shè)置,可參考官方鏈接 API 介紹:https://clinicaltrials.gov/data-api/api
獲取某一具體臨床試驗(yàn)信息
?獲取某一具體項(xiàng)目信息可以在 API 主路徑后面直接添加臨床試驗(yàn)項(xiàng)目編號(hào)即可,比如獲取項(xiàng)目?NCT05013879 臨床信息:
https://clinicaltrials.gov/api/v2/studies/NCT05013879
默認(rèn)會(huì)返回該項(xiàng)目所有可用數(shù)據(jù),包括方案(ProtocolSection)、結(jié)果(ResultsSection)、文檔(DocumentSection)和衍生(DerivedSection)四大部分,每一部分又包括許多模塊內(nèi)容,信息量非常豐富。通常我們只需要返回指定字段信息,可參照上面示例,通過添加參數(shù) fields 即可,比如,只返回項(xiàng)目編號(hào)、標(biāo)題和關(guān)鍵詞:
/NCT05013879?fields=NCTId,BriefTitle,Keyword
API 二次封裝
CT.gov API 提供了非常豐富的數(shù)據(jù)接口和參數(shù)供用戶選擇使用。在某些情況下,我們?yōu)榉奖阏{(diào)用和集成,也可以考慮對(duì)原生 API 進(jìn)行二次封裝,比如下圖所示,只返回部分指定感興趣內(nèi)容,并取消了原 API 返回?cái)?shù)據(jù)的多層級(jí)信息結(jié)構(gòu), 返回結(jié)果更加直觀,一目了然。
CT.gov 和其它同類型臨床試驗(yàn)數(shù)據(jù)庫一樣,作為一個(gè)免費(fèi)的公共資源,對(duì)于提高臨床研究透明度,增強(qiáng)公眾信任,避免重復(fù)研究,促進(jìn)科學(xué)知識(shí)的傳播和健康改善,發(fā)揮著越來越大的作用。本文通過對(duì) CT.gov 臨床試驗(yàn)數(shù)據(jù)庫內(nèi)容、結(jié)構(gòu)及其 API 數(shù)據(jù)接口使用等進(jìn)行了全面的描述,希望廣大臨床試驗(yàn)愛好者和相關(guān)研究人員,能夠更高效的使用該類型數(shù)據(jù)庫,更好的應(yīng)用到我們具體的臨床試驗(yàn)工作當(dāng)中,特別是其提供的 API 接口,用戶可以將這些數(shù)據(jù)自動(dòng)化地、集成到企業(yè)自身的業(yè)務(wù)場(chǎng)景,服務(wù)于具體的業(yè)務(wù)邏輯,包括但不限于輔助臨床試驗(yàn)設(shè)計(jì)、研究基地選擇、受試者招募、洞察臨床研究動(dòng)態(tài)、競(jìng)爭(zhēng)情報(bào)收集以及新藥研發(fā)趨勢(shì)分析等。我們也會(huì)在后續(xù)的文章中繼續(xù)給大家分享如何基于在線臨床試驗(yàn)數(shù)據(jù)庫進(jìn)行相關(guān)的臨床試驗(yàn)洞察與決策分析。
文章轉(zhuǎn)自微信公眾號(hào)@西鐵房
2024年您產(chǎn)品必備的10大AI API推薦
GraphRAG:基于PolarDB+通義千問api+LangChain的知識(shí)圖譜定制實(shí)踐
使用Node.js、Express和MySQL構(gòu)建REST API
天氣API推薦:精準(zhǔn)獲取氣象數(shù)據(jù)的首選
基于自定義數(shù)據(jù)集的微調(diào):Alpaca與LLaMA模型的訓(xùn)練
OAuth和OpenID Connect圖解指南
有哪些新聞媒體提供Open API?
現(xiàn)在做大模型,還有靠譜且免費(fèi)的API接口嗎?
如何運(yùn)用AI提高自己的工作效率?
對(duì)比大模型API的內(nèi)容創(chuàng)意新穎性、情感共鳴力、商業(yè)轉(zhuǎn)化潛力
一鍵對(duì)比試用API 限時(shí)免費(fèi)