v2.1

关于MogDB
- MogDB简介
- MogDB与openGauss
- MogDB发布说明
  - MogDB 2.1.1
  - MogDB 2.1.0
- 开源组件
- 使用限制
- 法律声明
快速入门
- MogDB实训平台
- 容器化安装
- 单节点安装
- 访问数据库
  - 使用命令行访问MogDB
    - gsql
    - pgcli
  - 使用图形工具访问MogDB
    - Data Studio
    - DBeaver
  - 使用中间件访问MogDB
    - WebLogic配置MogDB数据源参考
    - WebSphere配置MogDB数据源参考
  - 使用编程语言访问MogDB
    - Java
    - C/C++
    - Python
    - Go
    - Rust
    - NodeJS
- 使用样本数据集Mogila
特性描述
安装指南
- 容器化安装
- 极简安装
- 标准安装
- 手动安装
管理指南
- 日常运维
- 主备管理
- MOT内存表管理
- 列存表管理
- 备份与恢复
- 数据导出导入
  - 导入数据
  - 导出数据
- 升级指南
AI特性指南
- 概述
- Predictor：AI查询时间预测
- X-Tuner：参数调优与诊断
- SQLdiag：慢SQL发现
- Anomaly-detection：数据库指标采集、预测与异常监控
- Index-advisor：索引推荐
- DeepSQL：库内AI算法
- DB4AI：数据库原生AI引擎
安全指南
- 数据库安全管理
开发者指南
- 应用程序开发教程
  - 开发规范
  - 基于JDBC开发
  - 基于ODBC开发
  - 基于libpq开发
    - 基于libpq开发
    - libpq接口参考
      - 数据库连接控制函数
        说明
        PQconnectdbParams
        PQconnectdb
        PQconninfoParse
        PQconnectStart
        PQerrorMessage
        PQsetdbLogin
        PQfinish
        PQreset
        PQstatus
      - 数据库执行语句函数
        PQclear
        PQexec
        PQexecParams
        PQexecParamsBatch
        PQexecPrepared
        PQexecPreparedBatch
        PQfname
        PQgetvalue
        PQnfields
        PQntuples
        PQprepare
        PQresultStatus
      - 异步命令处理
        说明
        PQsendQuery
        PQsendQueryParams
        PQsendPrepare
        PQsendQueryPrepared
        PQflush
      - 取消正在处理的查询
        PQgetCancel
        PQfreeCancel
        PQcancel
      - 示例
      - 链接字符
  - 基于Psycopg开发
  - 调试
  - 附录
- 存储过程
- 用户自定义函数
- PL/pgSQL-SQL过程语言
- 定时任务
  - PKG_SERVICE接口
- 自治事务
- 逻辑复制
  - 逻辑解码
    - 逻辑解码概述
    - 使用SQL函数接口进行逻辑解码
- Foreign Data Wrapper
- 物化视图
  - 物化视图概述
  - 全量物化视图
  - 增量物化视图
- 资源负载管理
  - 资源负载管理概述
  - 资源管理准备
性能优化指南
参考指南
故障诊断指南
- 常见故障定位手段
- 常见故障定位案例
  - core问题定位
  - 权限/会话/数据类型问题定位
  - 服务/高可用/并发问题定位
  - 表/分区表问题定位
    - VACUUM FULL一张表后，表文件大小无变化
    - 执行修改表分区操作时报错
  - 文件系统/磁盘/内存问题定位
  - SQL问题定位
  - 索引问题定位
源码解析
常见问题解答 (FAQs)
术语表

审视和修改表定义

审视和修改表定义概述

好的表定义至少需要达到以下几个目标:

减少扫描数据数据量。通过分区的剪枝机制可以实现该点。
尽量减少随机IO。通过聚簇/局部聚簇可以实现该点。

选择存储模型

进行数据库设计时，表设计上的一些关键项将严重影响后续整库的查询性能。表设计对数据存储也有影响: 好的表设计能够减少I/O操作及最小化内存使用，进而提升查询性能。

表的存储模型选择是表定义的第一步。客户业务属性是表的存储模型的决定性因素，依据下面表格选择适合当前业务的存储模型。

存储模型	适用场景
行存	点查询（返回记录少，基于索引的简单查询）。增删改比较多的场景。
列存	统计分析类查询（group , join多的场景）。

使用局部聚簇

局部聚簇（Partial Cluster Key）是列存下的一种技术。这种技术可以通过min/max稀疏索引较快的实现基表扫描的filter过滤。Partial Cluster Key可以指定多列，但是一般不建议超过2列。Partial Cluster Key的选取原则:

受基表中的简单表达式约束。这种约束一般形如col op const，其中col为列名，op为操作符 =、>、>=、<=、<，const为常量值。
尽量采用选择度比较高（过滤掉更多数据）的简单表达式中的列。
尽量把选择度比较低的约束col放在Partial Cluster Key中的前面。
尽量把枚举类型的列放在Partial Cluster Key中的前面。

使用分区表

分区表是把逻辑上的一张表根据某种方案分成几张物理块进行存储。这张逻辑上的表称之为分区表，物理块称之为分区。分区表是一张逻辑表，不存储数据，数据实际是存储在分区上的。分区表和普通表相比具有以下优点:

改善查询性能: 对分区对象的查询可以仅搜索自己关心的分区，提高检索效率。
增强可用性: 如果分区表的某个分区出现故障，表在其他分区的数据仍然可用。
方便维护: 如果分区表的某个分区出现故障，需要修复数据，只修复该分区即可。

MogDB支持的分区表为范围分区表。

范围分区表: 将数据基于范围映射到每一个分区。这个范围是由创建分区表时指定的分区键决定的。分区键经常采用日期，例如将销售数据按照月份进行分区。

选择数据类型

高效数据类型，主要包括以下三方面:

尽量使用执行效率比较高的数据类型

一般来说整型数据运算（包括=、＞、＜、≧、≦、≠等常规的比较运算，以及group by）的效率比字符串、浮点数要高。比如某客户场景中对列存表进行点查询，filter条件在一个numeric列上，执行时间为10+s；修改numeric为int类型之后，执行时间缩短为1.8s左右。
尽量使用短字段的数据类型

长度较短的数据类型不仅可以减小数据文件的大小，提升IO性能；同时也可以减小相关计算时的内存消耗，提升计算性能。比如对于整型数据，如果可以用smallint就尽量不用int，如果可以用int就尽量不用bigint。
使用一致的数据类型

表关联列尽量使用相同的数据类型。如果表关联列数据类型不同，数据库必须动态地转化为相同的数据类型进行比较，这种转换会带来一定的性能开销。