课程培训
Cassandra培训课程体系(选修)

Cassandra培训课程体系(选修)

产品专题

专题一:Cassandra数据库管理基础
专题二:Cassandra数据建模与CQL开发
专题三:Cassandra高可用与一致性管理
专题四:Cassandra性能优化与调优
专题五:Cassandra备份恢复与集群管理
专题六:Cassandra云服务与生态工具

软件专题

专题七:Cassandra CQL深度开发与查询优化
专题八:Cassandra开发集成(Java/Python/Go)
专题九:Cassandra监控与运维自动化
专题十:Cassandra安全与权限管理
专题十一:Cassandra数据迁移与跨中心复制
专题十二:Cassandra高级特性与实践


专题一:Cassandra数据库管理基础

培训对象:

  • 新入职的数据库管理员、系统运维人员

  • 需要掌握Cassandra基础管理的开发人员

  • 准备DataStax Cassandra基础认证的初级从业者

培训目标:
掌握Cassandra的安装配置、体系结构、日常管理操作,能够独立完成集群搭建、节点管理、基本CQL操作,理解无中心架构的核心原理。

培训内容:

  1. NoSQL与Cassandra定位:列式数据库特性、CAP理论(AP)、最终一致性、适用场景(时序、消息、推荐等)

  2. Cassandra发展历史:从Facebook开源到DataStax商业化、版本演进

  3. 体系架构:无中心对等架构、Gossip协议、节点发现机制

  4. 数据模型基础:Keyspace、Table、Row、Column、Partition Key、Clustering Key

  5. 安装部署:单节点安装、多节点集群规划、配置文件(cassandra.yaml)核心参数

  6. 集群通信:Snitch(动态感知)、Gossip种子节点配置

  7. 客户端工具:cqlsh命令行使用、nodetool工具集、DataStax Studio

  8. 基本CQL操作:创建Keyspace、创建表、插入/查询/更新/删除数据

  9. 节点管理:启动/停止节点、节点状态查看(nodetool status)、节点添加/移除

  10. 日志管理:system.log调试、调试级别设置、慢查询日志

  11. 集群监控初步:nodetool info/tpstats/compactionhistory

  12. 综合实战:搭建三节点Cassandra集群并完成基本运维任务

专题二:Cassandra数据建模与CQL开发

培训对象:

  • 软件开发工程师、数据建模人员

  • 从关系型数据库转向Cassandra的开发人员

  • 需要设计高性能数据模型的架构师

培训目标:
掌握Cassandra数据建模的核心原则(围绕查询设计),能够根据业务访问模式设计合理的表结构、主键和二级索引,避免常见建模陷阱。

培训内容:

  1. 数据建模原则:围绕查询建模(Query-First Design)、反范式化、避免JOIN和事务

  2. 主键设计:Partition Key与Clustering Key的作用、唯一性保证、数据分布影响

  3. 查询驱动建模步骤:识别业务查询、设计表满足查询、评估性能与存储

  4. 表设计示例:用户表、时间序列表、物联网设备数据表

  5. 复合主键与排序:Clustering Key排序方向、多字段排序规则

  6. 二级索引:原生二级索引原理、局限性(性能、一致性)、何时使用

  7. 物化视图(Materialized View):自动维护视图表、适用场景、注意事项

  8. 轻量级事务(LWT):Compare-and-Set机制、性能影响、适用场景

  9. 集合类型:Set、List、Map的使用与限制(冻结集合、大小限制)

  10. 用户定义类型(UDT):嵌套结构、适用场景

  11. TTL(Time To Live):自动过期数据、表级和列级TTL

  12. 综合实战:为电商订单系统设计Cassandra数据模型

专题三:Cassandra高可用与一致性管理

培训对象:

  • 数据库管理员、系统架构师

  • 需要设计高可用、多数据中心方案的运维负责人

  • 准备DataStax高级认证的从业者

培训目标:
深入理解Cassandra高可用机制,掌握数据复制、一致性级别、多数据中心部署、故障检测与恢复,能够设计跨地域容灾架构。

培训内容:

  1. 数据复制机制:Partitioner(分区器)、Replication Factor、复制策略(SimpleStrategy/NetworkTopologyStrategy)

  2. 一致性级别:ONE、QUORUM、LOCAL_QUORUM、EACH_QUORUM、ALL等,读写一致性配置

  3. 读写协调过程:协调节点(Coordinator)、从副本读取、读修复(Read Repair)

  4. 提示移交(Hinted Handoff):临时故障处理、hint存储与重放

  5. 故障检测与恢复:Phi Accrual Failure Detector、节点恢复后的数据同步(Hinted Handoff/修复)

  6. 节点修复(Node Repair):nodetool repair必要性、增量修复、全量修复

  7. 多数据中心部署:NetworkTopologyStrategy配置、跨数据中心读写一致性

  8. 跨数据中心复制:每个数据中心独立副本因子、本地读优先

  9. 一致性权衡:强一致性与高可用的平衡、影响性能的因素

  10. 轻量级事务(LWT)与Paxos:内部Paxos协议实现、序列化一致性

  11. 容灾演练:节点故障模拟、数据中心故障模拟、恢复流程

  12. 综合实战:配置多数据中心集群并验证跨数据中心读写一致性

专题四:Cassandra性能优化与调优

培训对象:

  • 资深数据库管理员、性能优化工程师

  • 应用开发人员需要优化查询

  • 运维负责人

培训目标:
掌握Cassandra性能优化的核心方法,能够进行内存/磁盘/线程调优、Compaction策略选择、查询优化、硬件规划,提升集群吞吐和延迟。

培训内容:

  1. 性能影响因素:硬件、数据模型、查询模式、GC、操作系统

  2. 内存调优:堆内存设置、堆外内存、off-heap缓存、JVM调优基础

  3. 磁盘I/O优化:CommitLog/SSTable分离、Compaction I/O控制、RAID策略

  4. 线程池调优:并发读/写线程、Compaction线程数、TCP设置

  5. Compaction策略选择:SizeTieredCompaction、LeveledCompaction、TimeWindowCompactionStrategy适用场景

  6. 缓存配置:Key Cache、Row Cache、Counter Cache命中率优化

  7. 查询优化:避免全表扫描、ALLOW FILTERING使用限制、索引优化

  8. 分页查询:token函数分页、offset限制、高效游标

  9. 批量操作(Batch):使用场景、性能影响、atomicity权衡

  10. 监控工具:nodetool cfstats、tpstats、proxyhistograms解读

  11. GC优化:G1GC配置、GC日志分析、停顿排查

  12. 综合实战:对Cassandra集群进行全链路压测与优化

专题五:Cassandra备份恢复与集群管理

培训对象:

  • 数据库管理员、灾备管理人员

  • 需要制定备份策略的运维工程师

  • 负责集群日常运维的人员

培训目标:
掌握Cassandra备份恢复的多种方法,能够进行快照备份、增量备份、跨集群数据同步,并能执行数据恢复、集群重建等操作。

培训内容:

  1. 备份概述:数据一致性保证、备份窗口、RPO/RTO设定

  2. 快照备份(Snapshot):nodetool snapshot创建、增量备份与增量快照

  3. 备份文件管理:SSTable文件存储、提交日志备份可选项

  4. 恢复操作:快照恢复流程、同步恢复后的数据(incremental repair)

  5. 数据导入导出:COPY命令(CSV)、sstableloader工具(批量加载)

  6. 跨集群数据同步:Spark连接、DSBulk工具、自研ETL

  7. 集群扩缩容:添加新节点(bootstrap)、节点下线(decommission)、数据重新平衡

  8. 节点替换:硬件故障时用新节点替换、数据自动同步

  9. 集群升级:滚动升级步骤、版本兼容性、降级方案

  10. 元数据备份:system keyspace备份、schema导出

  11. 备份验证与演练:定期恢复演练、数据完整性检查

  12. 综合实战:执行节点替换和快照恢复演练

专题六:Cassandra云服务与生态工具

培训对象:

  • 云架构师、DevOps工程师

  • 需要将Cassandra部署到云环境的技术人员

  • 基于Cassandra的SaaS开发者

培训目标:
掌握云上Cassandra服务(如DataStax Astra、Amazon Keyspaces、阿里云Cassandra版)的使用方法,了解相关生态工具。

培训内容:

  1. 云Cassandra服务概览:DataStax Astra、Amazon Keyspaces、Azure Managed Instance for Cassandra、阿里云Cassandra

  2. DataStax Astra:无服务器模式、按量付费、内置监控

  3. Amazon Keyspaces:兼容Cassandra协议的AWS托管服务、容量模式

  4. 云上实例创建:网络配置(VPC)、安全组、访问控制(IAM)

  5. 连接与驱动:云服务连接方式(证书/令牌)、专用终端节点

  6. 备份与恢复:云服务内置备份、PITR、跨区域复制

  7. 监控与告警:云监控集成、性能指标、成本分析

  8. 迁移到云:cassandra-loader、AWS DMS、双写迁移

  9. 生态工具:DataStax Studio(数据建模与查询)、OpsCenter(监控管理)、K8s Operator

  10. 与大数据生态集成:Spark Connector、Flink Connector、Kafka Connect

  11. 客户端驱动兼容性:不同语言驱动对云服务的支持

  12. 综合实战:在DataStax Astra上创建集群并连接测试

专题七:Cassandra CQL深度开发与查询优化

培训对象:

  • 软件开发工程师

  • 需要编写复杂CQL查询的开发人员

  • 数据库性能调优人员

培训目标:
深入掌握CQL语法与高级特性,能够利用函数、聚合、条件更新、集合操作等编写高效查询,避免常见性能陷阱。

培训内容:

  1. CQL数据类型深入:uuid、timeuuid、duration、inet、tuple等

  2. 高级查询条件:IN、CONTAINS、LIKE(6.0+)、!=(6.0+)

  3. 聚合函数:COUNT、SUM、AVG、MIN、MAX(需ALLOW FILTERING)

  4. 分组与排序:GROUP BY(4.6+)、ORDER BY与分区内排序

  5. JSON支持:SELECT JSON、INSERT JSON、导出JSON

  6. 条件更新:IF EXISTS、IF NOT EXISTS、IF条件判断

  7. 批量操作优化:BATCH原子性保证、批量大小控制

  8. 计数器表:计数器类型、原子增量、适用场景

  9. 函数与表达式:WRITETIME、TTL、token、cast

  10. 索引性能考量:二级索引查询限制、索引选择建议

  11. 分页技术:paging state、自动分页、客户端游标

  12. 综合实战:使用CQL完成复杂报表查询(结合聚合与分页)

专题八:Cassandra开发集成(Java/Python/Go)

培训对象:

  • Java/Python/Go开发工程师

  • 需要连接Cassandra的应用开发者

  • 全栈开发人员

培训目标:
掌握主流语言连接Cassandra的客户端驱动使用方法,能够进行数据操作、连接池配置、异步处理,开发高性能应用。

培训内容:

  1. Java驱动:DataStax Java Driver(4.x/3.x)对比、依赖引入

  2. Java驱动基础:CqlSession构建、执行CQL、结果集处理

  3. Java驱动高级特性:异步执行、可重试策略、负载均衡策略(DCAware/TokenAware)

  4. Spring Data Cassandra集成:实体映射、CassandraRepository、模板使用

  5. Python驱动:DataStax Python Driver安装、Session配置、PreparedStatement

  6. Python异步支持:异步驱动(AIO)基础

  7. Go驱动:gocql包使用、连接配置、迭代器、扫描

  8. 连接池调优:连接数配置、心跳、空闲清理

  9. 异步与非阻塞:响应式编程与Cassandra结合(Reactive Cassandra)

  10. 对象映射框架:Kundera(JPA)、Achilles(高级对象映射)

  11. 数据一致性在客户端的实现:一致性级别配置、重试策略

  12. 综合实战:使用Spring Data Cassandra构建REST API

专题九:Cassandra监控与运维自动化

培训对象:

  • 数据库运维工程师、SRE

  • 监控系统建设人员

  • 需要构建自动化运维平台的工程师

培训目标:
掌握Cassandra监控体系与自动化运维工具,能够使用Prometheus、Grafana、DataStax OpsCenter等实现全栈监控和自动化管理。

培训内容:

  1. 监控指标分类:节点状态、吞吐量(读/写)、延迟(99th)、存储容量、GC活动

  2. DataStax OpsCenter:安装配置、监控面板、管理功能(修复/备份)

  3. JMX监控:Cassandra JMX MBean、jconsole/jmxterm使用

  4. Prometheus集成:cassandra-exporter、metric收集、配置

  5. Grafana仪表盘:预置面板导入、关键指标可视化

  6. 告警规则:节点宕机、高延迟、GC暂停、空间不足

  7. 日志分析:system.log、debug.log、gc.log分析工具

  8. nodetool命令自动化:脚本封装、状态检查、定期修复

  9. 自动化部署工具:Ansible Playbook、Chef Cookbooks

  10. 滚动升级自动化:版本升级步骤、健康检查

  11. 备份恢复自动化:定时快照、上传S3、恢复脚本

  12. 综合实战:使用Prometheus+OpsCenter构建完整监控体系

专题十:Cassandra安全与权限管理

培训对象:

  • 安全管理员、数据库管理员

  • 合规审计人员

  • 需要满足等保要求的系统负责人

培训目标:
掌握Cassandra安全配置,包括认证、授权、加密、审计,能够保护数据安全,满足合规要求。

培训内容:

  1. 安全框架:认证(Authentication)、授权(Authorization)、加密(Encryption)、审计(Audit)

  2. 认证配置:PasswordAuthenticator、LDAP集成、Kerberos(DataStax Enterprise)

  3. 角色与权限:CREATE ROLE、LOGIN、SUPERUSER、授权(GRANT/REVOKE)

  4. 对象权限:权限级别(ALL/ALTER/SELECT/MODIFY/DROP等)、级联授权

  5. 加密通信:node-to-node加密(TLS)、client-to-node加密

  6. 静态加密:数据文件加密(磁盘加密)、JVM系统属性

  7. 审计日志:审计类别配置、日志存储、告警集成

  8. 安全最佳实践:禁用默认端口、关闭不必要服务、最小权限原则

  9. 渗透测试基础:常见攻击向量(无认证、弱密码)

  10. 合规支持:与LDAP/AD集成、日志合规存储

  11. 网络安全策略:防火墙规则、安全组配置

  12. 综合实战:配置Cassandra集群启用认证与TLS

专题十一:Cassandra数据迁移与跨中心复制

培训对象:

  • 数据库架构师、数据迁移工程师

  • 需要执行异构数据迁移的技术人员

  • 多数据中心部署负责人

培训目标:
掌握从关系型数据库或其他NoSQL到Cassandra的数据迁移方法,以及跨数据中心的数据同步策略,确保数据无缝迁移和异地容灾。

培训内容:

  1. 迁移方法论:评估兼容性、数据建模调整、迁移工具选型

  2. 从RDBMS迁移:使用Spark Connector、读取JDBC写入Cassandra

  3. 从HBase迁移:利用ExportSnapshot、BulkLoad

  4. 从MongoDB迁移:自定义ETL、变更数据捕获(CDC)

  5. DSBulk工具:高性能批量导入导出、参数优化

  6. 实时同步:Kafka Connect Cassandra Sink Connector、CDC (Debezium)

  7. 跨数据中心复制:NetworkTopologyStrategy、异步复制、读写一致性

  8. 双活数据中心架构设计:本地读、本地写、冲突处理

  9. 迁移验证:数据一致性检查、性能对比、应用回归测试

  10. 停机迁移与在线迁移策略:双写、切流量

  11. 迁移后优化:compaction调整、缓存预热

  12. 综合实战:使用DSBulk将MySQL数据迁移到Cassandra

专题十二:Cassandra高级特性与实践

培训对象:

  • 高级数据库管理员、架构师

  • 需要利用Cassandra高级特性的技术专家

  • 准备DataStax高级认证的从业者

培训目标:
深入理解Cassandra高级特性,如物化视图、SASI索引、存储附加索引(SAI)、DSE特性,能够根据复杂场景设计优化方案。

培训内容:

  1. 物化视图深入:内部实现、性能影响、与二级索引对比

  2. SASI索引(实验性):字符串索引增强、性能分析

  3. 存储附加索引(SAI):DataStax Enterprise索引、索引选择建议

  4. 时序数据优化:TWCS Compaction策略、分区大小管理

  5. 计数器表高级应用:分布式计数器、批量递增

  6. 用户定义函数(UDF)与聚合(UDA):DSE/开源版本支持

  7. Spark与Cassandra集成优化:数据本地性、分区切分

  8. 搜索引擎集成:DSE Search(Solr)、Elasticsearch与Cassandra集成

  9. 多租户实现:使用Keyspace隔离、资源限制(cgroups)

  10. 故障自愈自动化:结合运维工具实现自动修复

  11. 混沌工程实验:注入故障、验证系统韧性

  12. 综合实战:设计支持多租户、时序大数据的Cassandra架构





如果您想学习本课程,请预约报名
如果没找到合适的课程或有特殊培训需求,请订制培训
除培训外,同时提供相关技术咨询与技术支持服务,有需求请发需求表到邮箱soft@info-soft.cn,或致电4007991916
技术服务需求表点击在线申请

服务特点:
海量专家资源,精准匹配相关行业,相关项目专家,针对实际需求,顾问式咨询,互动式授课,案例教学,小班授课,实际项目演示,快捷高效,省时省力省钱。

专家力量:
中国科学院软件研究所,计算研究所高级研究人员
oracle,微软,vmware,MSC,Ansys,candence,Altium,达索等大型公司高级工程师,项目经理,技术支持专家
中科信软培训中心,资深专家或讲师
大多名牌大学,硕士以上学历,相关技术专业,理论素养丰富
多年实际项目经历,大型项目实战案例,热情,乐于技术分享
针对客户实际需求,案例教学,互动式沟通,学有所获
报名表下载
联系我们 更多>>

咨询电话010-62883247

                4007991916

咨询邮箱:soft@info-soft.cn  

 

  微信咨询

随时听讲课

聚焦技术实践

订制培训 更多>>