news 2026/6/14 19:26:24

非结构化数据的隐私性较低吗?

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
非结构化数据的隐私性较低吗?

从听过任何关于人工智能讨论的调查来看,我们都知道隐私很重要。

我们一次又一次地听到人们谈论如何实现某种类型的人工智能系统,但他们担心涉及的隐私问题。

有时候,从整体格局的细致角度来看,能让我们看到如何做得更好。

例如,新系统越来越能够分析非结构化数据,并将所有相关数据点聚合成统一整体。

这对隐私意味着什么?非结构化数据本质上就不那么个人化,也不那么敏感吗?

把这大量非结构化数据看作是涵盖各种可能涉及任何内容的信息的总包。从这个角度看,从这么宽广的字段获取数据似乎比收集一个精心填充的数据库(里面有人员身份和可能的敏感财务信息如账号等)要小得多。

但你仍然可以有一些相当私密的数据存在于非结构化数据集中。例如,一封与某人HIPAA信息相关的信件,至少在肉眼看来可能没有包含这些内容。但当你用更强大的引擎拿回洞察时,你可能会发现机器能够从一些意想不到的地方提取敏感数据。

社交媒体的例子就是看待这个问题的一种方式。社交媒体是非结构化数据——我们都知道这一点——我们习惯在Facebook或 X 或微博 或在这上看到各种关于自己的故事。你可能会想,嗯,它没有我的社会安全号码或银行账户号码。但鱼叉式钓鱼者并不总是需要这些标识符,只要他们有正确的故事。此外,人工智能可能能够整合各种推断、时间线和影响,构建出令人恐惧的个人故事。比如想想保险欺诈侦探如何利用社交媒体。它可能会抓到欺诈行为——但侵入性有多大?

那么,新的人工智能系统是如何做到这一点的呢?如果你看硬件,我们正进入一个人工智能可以从更结构化数据集转向一种通用技术,吸收大量数据,以至于你可能会认为它接近普世知识的时代。

在最近一次参与某个AI活动中,一位专家谈到了一款拥有90万个核心和40亿晶体管的芯片,它便于扩展并消除并行编程。但她指出,这些系统在处理非结构化数据方面也更有能力。额外的能力有助于搜寻更广泛的知识库并收集你想要的东西。

“如今我们能够在单一系统上运行巨大的模型。因此,我们可以通过数据并行性快速且便捷地扩展。因此,不需要像威震天那样复杂的并行编程库......作为企业,通过开发者使用我们的系统,他们可以专注于人工智能,而非复杂的并行编程。因此,他们可以更快地开始和扩展工作。

一个视角是数据治理。你可以识别数据在AWS对象存储中的位置,以及随之而来的元数据。你可以开始分析AI是否能够从它通过非结构化数据中收集到的零碎信息构建敏感信息模型。首先,正如许多人现在问的那样:谁拥有这些数据?

随着进展,我们将开始看到隐私威胁的所在。或者如果我们不这样做,可能会在用户的个人体验层面看到这些问题,人们理所当然地感到不满。

我得说硬件本身相当令人印象深刻。这些工艺远远超出了多核技术的简单概念。看起来他们会把明天的数据中心变成你手中拿着的东西。

无论如何,当我们思考非结构化数据时,我们应该考虑它被简化、精炼和精炼后会是什么样子,机器能从中推测出关于你的一切!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/13 18:41:44

如何快速掌握CodeLlama-34b-Instruct-hf:开发者的终极指南

如何快速掌握CodeLlama-34b-Instruct-hf:开发者的终极指南 【免费下载链接】CodeLlama-34b-Instruct-hf 项目地址: https://ai.gitcode.com/hf_mirrors/ai-gitcode/CodeLlama-34b-Instruct-hf CodeLlama-34b-Instruct-hf作为Meta推出的34亿参数指令调优模型…

作者头像 李华
网站建设 2026/6/13 16:10:36

1小时快速搭建:Linux Docker原型验证

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 请设计一个快速原型开发模板,包含:1. 多语言选择(Python/Node.js/Go)2. 预配置的开发容器 3. 热重载支持 4. 内置测试框架 5. 一键部…

作者头像 李华
网站建设 2026/6/12 9:55:11

Qwen3-14B-AWQ:在消费级硬件上运行140亿参数大模型的终极指南

你是否曾因大模型高昂的硬件要求而望而却步?Qwen3-14B-AWQ正是为你量身打造的解决方案。这款来自阿里巴巴通义千问团队的轻量化模型,通过AWQ 4-bit量化技术将140亿参数压缩至消费级GPU可承受范围,让你在单张显卡上就能享受顶级AI能力。 【免费…

作者头像 李华
网站建设 2026/6/12 3:37:48

5步实现云顶之弈智能托管系统:零基础配置到高效运行全攻略

5步实现云顶之弈智能托管系统:零基础配置到高效运行全攻略 【免费下载链接】LOL-Yun-Ding-Zhi-Yi 英雄联盟 云顶之弈 全自动挂机刷经验程序 外挂 脚本 ,下载慢可以到https://gitee.com/stringify/LOL-Yun-Ding-Zhi-Yi 项目地址: https://gitcode.com/gh_mirrors/l…

作者头像 李华
网站建设 2026/6/12 12:48:08

25G光模块:驱动5G与数据中心升级的关键引擎

随着5G网络的大规模部署和数据中心流量激增,网络接口正经历从10G到25G的代际跨越。25G SFP28光模块以其翻倍的带宽和优异的性价比,成为支撑5G前传、数据中心互联及企业核心网络升级的主流选择。面对多样的应用场景,25G光模块已发展出丰富的技…

作者头像 李华
网站建设 2026/6/13 13:58:15

从零到一:AI游戏辅助的技术探索之旅

在当今游戏竞技领域,AI游戏辅助技术正悄然掀起一场革命。你是否好奇,深度学习如何让计算机像人类一样精准识别目标?目标检测算法又是怎样实现智能瞄准的?让我们一起踏上这场技术探索之旅,揭开RookieAI_yolov8项目背后的…

作者头像 李华