TOC
需求
CPU
从预构建的deb包进行安装,使用x86_64
架构并支持SSE4.2指令集的CPU。在不支持SSE 4.2或使用AArch64
或PowerPC64LE
架构的处理器上运行ClickHouse,应该从源码构建ClickHouse。
ClickHouse实现了并行数据处理并使用所有可用硬件资源。在选择处理器时,考虑到ClickHouse在具有大量核心但时钟率较低的配置下比在具有较少核心和更高时钟率的配置下工作效率更高。例如,16核2600MHz要优于8核3600MHz。
建议使用睿频加速和超线程技术。它显著提升了典型工作负载的性能。
内存
推荐使用最小4GB内存执行重要查询。ClickHouse服务器可以运行在非常小的内存上,但是处理查询需要内存。 内存所需的容量取决于:
- 查询的复杂度。
- 查询处理的数据量。
要计算所需的内存容量,可以评估GROUP BY``DISTINCT``JOIN
以及使用其他的操作的临时数据的大小。
ClickHouse可以使用外部内存存储。详情参考GROUP BY
在外部内存。
Swap文件
生产环境禁用swap文件。
存储子系统
需要2GB空闲磁盘安装ClickHouse。
数据所需的存储容量应单独计算。评估应该包括:
- 数据量评估
可以从数据中抽取样本,并从中获得一行的平均大小。然后将该值乘以计划存储的行数。
- 数据压缩率
估算数据压缩率,导入抽样数据到ClickHouse,然后比较数据的实际大小与存储表的大小。例如,点击流数据通常被压缩6-10倍。
计算数据存储的最终容量,应用压缩率评估数据容量。如果计划在多个副本存储数据,评估的容量要乘以副本数。
网络
如果可能的话,使用10G或更高级别的网络。
网络带宽对于处理带有大量中间数据的分布式查询至关重要。此外,网速影响复制进程。
软件
ClickHouse主要为Linux系列操作系统开发。推荐的Linux发行版是Ubuntu。在系统中应该安装tzdata
包。
ClickHouse也可以在其他系列操作系统上运行。参考文档的开始使用章节。
「如果这篇文章对你有用,请支持一下哦」
如果这篇文章对你有用,请支持一下哦
使用微信扫描二维码完成支付