首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

#数据

LLM 系列(四):神奇的魔法数 27

磊叔的技术博客

当要求大型语言模型(LLMs)在1-50范围内生成"随机"数字时,它们表现出明显的偏向性,特别是对数字27的强烈偏好。 这一现象并非技术缺陷,而是反映了人类认知...

1500

【存储100问】TCO分析:不同比例闪存下的成本

数据存储前沿技术

最近阅读到一份来自 中国电子信息产业发展研究院,推动全闪存数据中心建设,助力数字经济高质量发展的研究报告,内容指出:

1400

从前车马很慢,现在湖仓很快,一个Doris够用一辈子

一臻数据

1. 交易数据在MySQL里 -> 2. 历史数据在Hive里 -> 3. 日志文件在S3上 -> 4. 用户行为数据在Kafka里

900

6月19日,或许是一场被誉为史上最震撼、规模最大的数据显示泄露事件震惊全球

IT运维技术圈

又来活了老铁们!还记得五月份那次1.84亿条凭证泄露吧?现在倒好,数据泄露直接飙到天文数字——就在昨天(6月19日),安全研究人员确认了史上最大规模的数据泄露事...

1100

Nat.Biotechnol. | moPepGen:一种高效识别非典型肽段的图算法

DrugAI

当前蛋白质组基因组学在解析基因表达复杂性方面面临重大挑战。为此,研究人员开发了 moPepGen——一种基于图结构的算法,能够在保持线性计算复杂度的同时,全面生...

2000

Nat. Mach. Intell. | 引入掩码先验的扩散建模优化逆蛋白质折叠预测

DrugAI

在 TS50 和 PDB2022 这两个与训练数据完全独立的数据集上,MapDiff 依旧展现出领先的性能,尤其在氨基酸保守替代性指标(如 NSSR90)上显著...

1900

绝对式编码器还是增量式编码器(Absolute encoders vs. incremental encoders)

Hello工控

我们在选择编码器时,经常考虑选择增量式还是绝对式的。不论是线性编码器还是旋转编码器都有这两种方式可供选择。

1500

Staff+ 工程师如何发展战略思维

深度学习与Python

作为工程师,我们天生擅长批判性思维。我们分析数据,从逻辑上分解问题,并找到引导我们找到解决方案的模式。面对复杂挑战时,我们还会利用创造性思维。我们超越那些显而易...

800

首个「万亿级时间点」预训练,清华发布生成式时序大模型日晷 | ICML Oral

新智元

时序预测的非确定性来自时序数据的分布异构性。时序数据还存在其他异构性:例如维度异构,语义异构等。目前时序大模型尚处于如何有效处理时序数据异构性的阶段

2600

腾讯云ChatBI:数据解读重磅升级,深度挖掘数据价值

腾讯QQ大数据

腾讯云ChatBI是腾讯云BI打造的一款智能分析Agent,基于大模型AI技术,支持用户以自然语言提问即可获取数据结论。ChatBI可以帮助用户从数据中发现变化...

1800

降本30%,提速2小时!腾讯云助力火花思维大数据引擎“换挡”升级

腾讯QQ大数据

在数字化浪潮中,大数据已成为企业竞争力的核心要素。对于在线教育企业而言,大数据更是其实现个性化教学、精准营销和高效运营的关键。火花思维,作为逻辑思维垂直赛道的佼...

1500

[计算机网络] 网络的诞生:协议的认知建立

DevKevin

当有数据从网络到达时,网卡接收到数据,并通知操作系统。操作系统通过网卡驱动程序获取数据,然后将数据传递给 TCP/IP 协议栈进行逐层解封装,最终将数据传递给相...

2000

四舍五入(PUT & ROUND) 与 数据顺序影响Proc means 结果

归海刀刀

通常生成summary table的时候会对统计量进行四舍五入以达到相应的保留位数要求, 可是同一批数据,对于传入proc mean数据集的顺序不同会产生不同的...

4510

作物产量、植被指数、物候数据下载网站合集

疯狂学习GIS

  本文对目前主要的作物类型与产量、植被物候与指数数据产品的获取网站加以整理与介绍。

2410

8天涨了17万粉,5000万播放,他把AI ASMR带向了最高潮。

数字生命卡兹克

现在是凌晨1点,这是我听这个视频的第八遍,我不知道你们什么感觉,我自己还是有一种,皮肤触电、后脖发热,没事一抽抽的奇妙爽感。

5910

大厂选妃记:6位OLAP数据分析引擎,谁才是真爱?

一臻数据

Yandex出品,专门为实时数据分析而生。它的列式存储和快速查询能力,让很多工程师第一次使用就被震撼到。

3310

专题:R,Python时间序列分析​​递进式学习路径​ARIMA,SARIMA,LSTM,DLNM模型

拓端

在数据科学领域,时间序列分析作为揭示数据动态规律的核心技术,正经历从传统统计方法向智能算法的深度演进。回顾拓端数据部落为某能源集团完成的咨询项目,我们曾通过构建...

5110

DINO-R1:激励推理能力的视觉基础模型

AI浩

近期,人们对大型语言模型(如DeepSeek-R1)推理能力的关注呈爆炸式增长,通过基于强化学习的微调框架(如组相对策略优化(Group Relative Po...

2900

从 GPT 到 Agent,技术与业务如何“双向奔赴”

深度学习与Python

在当今科技浪潮中,创新者与企业正面临着技术信仰与商业铁律激烈碰撞带来的严峻挑战,深陷技术悬崖、工程鸿沟、商业迷雾三大困局之中。那么,什么是识别“高价值 - 可工...

2200

药物发现 | 基于人工智能的胰腺癌协同药物组合发现

生信菜鸟团

【优质期刊】文献【泛读,精读】笔记。关注癌症,生信,多组学,数据库,科研工具,精准医学,临床研究,生物技术,计算机技能,大语言模型的应用。

3310
领券