Skip to content

Latest commit

 

History

History
263 lines (195 loc) · 6.07 KB

File metadata and controls

263 lines (195 loc) · 6.07 KB

快速部署 AliSQL DuckDB 节点

[ How to setup DuckDB node in AliSQL | 快速部署 AliSQL DuckDB 节点 ]

概述

AliSQL 集成 DuckDB 作为分析型存储引擎。典型用法是:

  • 用户数据:存入 DuckDB 引擎
  • 系统表与元数据:仍由 InnoDB 保存(例如 mysql.*、数据字典等)

你可以:

  1. 从零初始化一个 DuckDB 为默认引擎 的新实例
  2. 将现有 InnoDB 实例一键转换 为 DuckDB
  3. 构建 DuckDB 从节点(HTAP/读写分离),从主库复制数据用于分析

1. 从零开始构建 DuckDB 实例(推荐新建实例)

适用于:初始化一个全新实例,后续新建表默认落入 DuckDB.

1.1 安装 AliSQL 8.0.44

方式 A:从源码编译安装

git clone https://github.com/alibaba/AliSQL.git
cd AliSQL

# Build (release)
sh build.sh -t release -d /opt/alisql

# Install
make install

方式 B:使用 RPM 安装包

# 示例安装 x86 架构下 centos 8 的 AliSQL 8.0.44
wget https://github.com/alibaba/AliSQL/releases/download/AliSQL-8.0.44-1/alisql-8.0.44-1.el8.x86_64.rpm
rpm -ivh alisql-8.0.44-1.el8.x86_64.rpm

1.2 初始化目录与生成配置文件脚本

说明:脚本要求传入绝对路径,并生成目录结构与 alisql.cnf

cat > init_alisql_dir.sh <<'EOF'
#!/usr/bin/env bash
set -euo pipefail

# Usage:
#   ./init_alisql_dir.sh <absolute_path>
# Example:
#   ./init_alisql_dir.sh /root/alisql_8044

if [[ $# -ne 1 ]]; then
  echo "Usage: $0 <absolute_path>"
  exit 1
fi

DIR="$1"
if [[ "$DIR" != /* ]]; then
  echo "Error: Argument must be an ABSOLUTE PATH (starting with /)."
  echo "Current input: $DIR"
  exit 1
fi

DIR="${DIR%/}"
echo "Initializing AliSQL directories at: $DIR"

mkdir -p \
  "$DIR/data/dbs" \
  "$DIR/data/mysql" \
  "$DIR/run" \
  "$DIR/log/mysql" \
  "$DIR/tmp"

cat > "$DIR/alisql.cnf" <<EOF2
[mysqld]
# --- Paths ---
datadir = ${DIR}/data/dbs
socket  = ${DIR}/run/mysql.sock
pid-file = ${DIR}/run/mysqld.pid
tmpdir  = ${DIR}/tmp

# --- Basic ---
character_set_server = utf8mb4
skip_ssl
lower_case_table_names = 1
core-file

# --- Logs ---
log-error = ${DIR}/log/mysql/error.log

# Binary logging (optional; enable if you need replication/point-in-time recovery)
log-bin = ${DIR}/log/mysql/mysql-bin
binlog_format = ROW

# --- InnoDB (system tables / metadata) ---
innodb_data_home_dir = ${DIR}/data/mysql
innodb_log_group_home_dir = ${DIR}/data/mysql

# --- DuckDB Storage Engine ---
duckdb_mode=ON
force_innodb_to_duckdb=ON

# DuckDB resources (0 = auto)
duckdb_memory_limit=2147483648
duckdb_threads=0
duckdb_temp_directory=${DIR}/tmp
EOF2

echo "OK: Directory structure created."
echo "Config file: $DIR/alisql.cnf"
EOF

chmod +x init_alisql_dir.sh

更多配置参数可参考:


1.3 初始化并启动实例

# Example: store all data under $HOME/alisql_8044
./init_alisql_dir.sh $HOME/alisql_8044

# Initialize
/opt/alisql/bin/mysqld --defaults-file=$HOME/alisql_8044/alisql.cnf --initialize-insecure

# Start, the port is 3306 by default
/opt/alisql/bin/mysqld_safe --defaults-file=$HOME/alisql_8044/alisql.cnf &

1.4 验证与使用

即使不显式写 ENGINE=DuckDB,当 force_innodb_to_duckdb=ON 时,用户侧创建/变更 InnoDB 表将被自动转换为 DuckDB 引擎。

CREATE DATABASE test;
USE test;

-- 创建 DuckDB 表
CREATE TABLE t (
  id INT PRIMARY KEY,
  name VARCHAR(255)
) ENGINE = DuckDB;

-- 引擎转换
ALTER TABLE t ENGINE = InnoDB;
ALTER TABLE t ENGINE = DuckDB;

-- DML
INSERT INTO t VALUES (1, 'John');
SELECT * FROM t;
UPDATE t SET name = 'Jane' WHERE id = 1;
DELETE FROM t WHERE id = 1;

-- DDL
ALTER TABLE t ADD COLUMN age INT;
ALTER TABLE t RENAME TO t_new;

2. 从现有 InnoDB 实例一键转换为 DuckDB

适用于:希望将历史数据整体迁移到 DuckDB 以提升分析性能。

步骤

  1. 停止现有实例 确保 MySQL 实例已 clean shutdown。

  2. my.cnf 增加参数

[mysqld]
duckdb_mode=ON
force_innodb_to_duckdb=ON

duckdb_memory_limit=2147483648
duckdb_threads=0
duckdb_temp_directory=/path/to/duckdb_temp_dir

# Convert all InnoDB tables at startup
duckdb_convert_all_at_startup=ON
duckdb_convert_all_at_startup_threads=32
duckdb_convert_all_at_startup_ignore_error=ON
  1. 启动实例

  2. 验证转换状态与结果

-- 检查转换阶段
SHOW GLOBAL STATUS LIKE 'DuckDB_convert_stage_at_startup';

-- 查询 DuckDB 表
SELECT table_schema, table_name, engine
FROM information_schema.tables
WHERE engine = 'DuckDB';

注意事项

  1. 启动自动转换会大量读写数据并占用 CPU/IO;建议通过 error log 观察进度与报错。
  2. 转换过程中可能需要额外磁盘空间(建议预留 ≥ 原始数据大小)。
  3. 转换前务必备份(推荐使用备份集拉起 DuckDB 节点)。
  4. MySQL 5.7 及以下请先升级到 8.0。
  5. 非 8.0.44 的实例启动后可能触发升级流程,建议先确保 clean shutdown。

3. 构建 DuckDB 从节点(HTAP / 读写分离)

适用于:主库(InnoDB/OLTP)负责事务,从库(DuckDB/AP)负责复杂分析;通过 binlog 复制同步数据。

步骤

  1. 准备主库
  • 开启 binlog
  • binlog_format=ROW
  • 开启 GTID
  1. 配置从节点 my.cnf
[mysqld]
duckdb_mode=ON
duckdb_require_primary_key=ON
force_innodb_to_duckdb=ON

duckdb_dml_in_batch=ON
duckdb_update_modified_column_only=ON
duckdb_multi_trx_in_batch=ON
duckdb_multi_trx_timeout=5000
duckdb_multi_trx_max_batch_length=268435456
  1. 初始化从节点实例 参考第 2 节(可选启用启动转换)或按第 1 节新建实例。

  2. 建立主从复制

CHANGE MASTER TO
  MASTER_HOST='your-master-ip',
  MASTER_USER='repl',
  MASTER_PASSWORD='your-password',
  MASTER_AUTO_POSITION=1;

START SLAVE;
  1. 完成 复制建立后,将分析/报表查询路由到 DuckDB 从节点。