关于openGemini

openGemini大约 4 分钟约 1276 字

简介

openGemini是一款面向IoT和Devops场景垂直优化的分布式时序数据库,提供单机和分布式版本,具备卓越的读写性能和高效的数据分析能力,支持主流开发语言和多形态部署(如云、Docker、物理机等)。openGemini主要聚焦于海量时序数据的存储和分析,通过技术创新,降低海量时序数据存储成本,简化业务系统架构,提升时序数据存储和分析效率。

openGemini背靠华为云丰富的IoT和Devops场景,经受住了海量时序数据管理的实战考验。自开源以来,不断收到来自社区用户的正向反馈,已累积在60+企业测试和生成落地使用。

秉承开发、合作、共赢的开源理念,openGemini社区吸引了来自浙江大学、上海交通大学、哈尔滨工业大学、山东大学、电子科技大学、华中师范大学、东北大学、美国加州大学、印度Amity University Noida等国内外20余所著名高校数十位优秀同学在社区学习、贡献代码、提交Bug报告和提出改进建议。

除此之外,openGemini也吸引了包括天翼云、沃趣、国能数智、移远通信、华为云IoT等在内的很多企业开发者的关注并加入社区贡献,共同推动了openGemini的快速发展。

在信通院发布的2023下半年可信开源领域最新评估成果中,openGemini顺利通过可信开源项目和可信数据库两项认证。与此同时,openGemini凭借在社区治理和社区活跃度方面的出色表现,获得开放原子基金会授予的“2023年度快速成长开源项目”奖项。

项目发起方华为云数据库创新Labopen in new window

五大核心特性

高性能

支持亿级时间线和PB级时序数据管理,每秒千万级数据写入和毫秒级查询响应,相比InfluxDB,简单查询性能提升2-5倍,复杂查询性能提升60倍

分布式

采用MPP大规模并行处理分层架构,由ts-sql、ts-meta、ts-store三个组件组成,各组件可独立扩展,支持100+节点的大规模集群部署

存储分析一体化

内置AI数据分析平台,提供了对时序数据的实时异常检测能力,实现了数据从存储到分析完整的闭环管理

运维成本低

提供260+项系统运行监控指标,快速提升问题解决的效率。部署过程中不依赖任何第三方组件和应用,极大降低了运维难度和成本

高数据压缩率

采用列式存储方式,提供高效数据压缩算法,相同数据量下存储成本仅有关系型数据库的1/20,NoSQL的1/10。

典型应用场景

可观测性(Observability)

分类应用举例
DevOps存储IT基础设施和应用的监控指标、调用链和日志,例如云服务、容器、微服务、物理服务器等,实现实时状态监控、异常检测和预测、根因分析、告警、统计分析。
网络存储网络设备和系统的数据,例如上下行带宽、流量、应用APIs成功率、访问IP等等,实现网络性能实时洞察、错误实时告警、网络攻击检测等
安全存储审计日志:对应用程序、数据库、虚拟机、操作系统、服务器、网络组件、存储等任何操作日志。可识别安全事件、监控策略违规、举证

物联网(IoT)

分类子行业应用举例
工业物联网智能制造、智慧能源、电力(水)、新能源(光伏、风电)、智慧矿山,农牧业以智能制造为例, 设备管理:设备运行状态监控,预测性维护; 质量管理:故障预测和分析、质量追溯、工艺优化、质量在线监控; 能源管理:能耗分析、用电监测; 其他:BI/报表
企业物联网智慧城市、智慧消防、智慧楼宇、环境监测、智慧物流、智慧园区以智慧楼宇为例, 设备管理:设备健康检查(空调、风机、电梯)、设备预测性维护、故障界定; 监控告警:异常检测、预测; 能源管理:用电监测,能耗分析预测; 环境监测:空气质量监测、室内温度监测
消费物联网智能汽车、智慧家居、智能穿戴、共享经济(共享单车、共享汽车、共享电动车)、智慧养老以智能汽车为例, 车辆管理:车辆实时状态监控,车辆异常检测; 人车互动:运行位置查询、轨迹回放、驾驶行为查询; 产品创新优化:驾驶行为分析、车况分析