news 2026/4/22 14:34:21

UKB数据库/RAP平台批量下载数据教程

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
UKB数据库/RAP平台批量下载数据教程

使用 Table Exporter方法
第一步:
通过在本地终端(请确保你的机器上安装了dx-toolkit)或ttyd终端,执行以下命令,获取包含你数据集中所有可用数据字段的文件:

dx extract_dataset project-xxxx:record-yyyy -ddd --delimiter ","
where project-xxxx:record-yyyy is ID of your Dataset

【安装dx-toolkit】打开本地电脑中的Anaconda Prompt
【安装dx-toolkit】在Anaconda Prompt中输入

pip install dxpy

系统会进行自动安装。

假如出现类似以下报错:

WARNING: The scripts dx, dx-app-wizard, dx-build-app and dx-build-applet are installed in '/Users/user-amy/Library/Python/3.9/bin' which is not on PATH. Consider adding this directory to PATH

说明需要更新电脑的PATH环境变量配置,以包括pip安装新命令的路径(具体解决方案自行百度)。

【CLI登录】在Anaconda Prompt中输入

dx login

服务器连接成功后按提示输入RAP的用户名和密码即可

现在输入:

dx extract_dataset project-xxxx:record-yyyy -ddd --delimiter ","

注意!

project-xxxx:record-yyyy为你的数据库 例如xxxxx.dataset

完成后有三个文件

上述命令将生成3个*.csv文件,其中*.dataset.data_dictionary.csv文件包含所有可用数据字段的完整信息(字段名称位于称为 的第二列name)。

where project-xxxx:record-yyyy is ID of your Dataset

【登出/注销CLI】使用完毕养成好习惯需要登出/注销,在Anaconda Prompt中输入:

dx logout

第二步:
接下来使用Table Exporter

收集所有感兴趣的数据字段名称,并写入field_name.txt文件。文件应有1列,每行只有1个数据字段名称。上述文件应仅包含同一实体中的数据字段(例如“参与者”、“olink_instance_0”等)。不同实体中的数据字段应写入独立文件。用于的值可以在.dataset.data_dictionary.csv文件的第一列中找到(注:这与entity_dictionary.csv文件中的不同)

注意这一步:
可以在自己电脑上新建txt,
但是!
需要用Visual Studio Code软件将txt转化为unix格式的txt !!!
也可,自行百度查看其他方法windows的txt转unix的txt.

用 VS Code 打开文件 查看右下角状态栏,会显示 "CRLF" 或 "LF" 点击 "CRLF" 或 "LF",选择 "LF" 保存文件

第三步
将field_name.txt文件上传到RAP项目

根据需要,
我用这个

注意:指定实体会快更多!


到这个就批量下载完成!

RAP官网下载教程如下:

https://dnanexus.gitbook.io/uk-biobank-rap/working-on-the-research-analysis-platform/accessing-data/accessing-phenotypic-data
https://documentation.dnanexus.com/developer/apps/developing-spark-apps/table-exporter-application

可进行进一步参考!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/17 19:40:05

Nginx 站点垂直扩容(单机性能升级)全攻略

核心:不改变架构、仅升级单台 Nginx 服务器的硬件 / 配置,快速提升并发承载能力,是流量初期增长的最优解,成本低、实施快,优先落地这一套即可解决大部分初期瓶颈。✅ 先明确:Nginx 单机瓶颈核心点Nginx 是事…

作者头像 李华
网站建设 2026/4/18 16:45:03

2026改一个越用越旺的昵称(收藏版)

🍥兜里藏金ᐝ࿐ 吸钞💸体质拉满ཀོ࿐暴富锦鲤ꚸ附体Չᐝ࿐ᩚ ༄ᐝ财运爆棚ഒᩚ࿐🌼᭄好运ꚸ超载Չᐝ࿐ᩚ ꪋꪆ꫁⁵⁰月薪百万꧔🎀᭄༣财神敲门🏠ଓꦿ࿐ 🌼᭄快乐ꚸ溢屏Չᐝ࿐ᩚꪋꪆ᭄好运💕扎堆…

作者头像 李华
网站建设 2026/4/17 17:16:40

智慧医院新范式!东软与西安交通大学第一附属医院全面战略合作

近日,东软集团与西安交通大学第一附属医院共同签署战略合作协议。双方将围绕智慧医院、医工结合、医疗健康产业创新等方面,开启多维度、多层次的全面战略合作。这是双方二十余年稳定、互信合作中的又一里程碑式成果,标志着双方实现了从业务领…

作者头像 李华
网站建设 2026/4/22 16:48:45

开源推荐--RustDesk:基于Rust的远程桌面神器,彻底告别TeamViewer/AnyDesk!

摘要:在远程办公和运维日益普及的今天,TeamViewer和AnyDesk的商业检测和连接限制让许多用户感到头疼。本文将深入介绍一款基于Rust编写的开源远程桌面软件——RustDesk。它不仅轻量、安全,更支持自建服务器,让你完全掌控自己的数据…

作者头像 李华
网站建设 2026/4/18 7:41:21

三维EKF实现无人机高精度悬停控制

目录 1. 三维 EKF 设计 状态向量 状态方程(预测) 2. 观测方程(更新) GPS 观测矩阵: 光流观测矩阵: 气压计观测矩阵: 3. 代码实现(STM32 HAL 库) 4. 集成到无人机…

作者头像 李华
网站建设 2026/4/21 9:46:22

虾皮店铺页面如何优化

在Shopee经营店铺时,卖家常常需要依据商品类目与店铺配置来增加产品曝光,这使得优化店铺页面变得十分重要。那么具体可以从哪些方面着手改进呢? 1、店铺头像 头像最好与销售品类相关,并符合当地审美偏好,设计应鲜明、…

作者头像 李华