LicheePi Cluster 4A

更新历史
日期 版本 作者 更新内容
2023-09-07 v0.1 30028
  • 初次编写文档

简介

Lichee Cluster 4A (以下简称 LC4A ) 是矽速科技研发的高性能 RISC-V 集群计算平台,可以用于构建多节点计算集群,而且还是学习 Kubernetes、自动化、边缘人工智能计算、本地迷你服务器,托管应用程序、容器等的优秀工具。单个 Lichee Cluster 4A 最多可装配 7 个 LM4A 核心板,每个 LM4A 核心板含有 4TOPS@int8 AI 算力的 NPU,单核心板最大支持 16GB LPDDR4X 内存和 128G eMMC 存储,整个集群有强大的灵活性和可扩展性。

Lichee Cluster 4A 板载八口千兆交换机以提供高速连接,轻松将多个节点连接起来,组成强大的计算集群,还支持 USB3.0 和 SD 卡存储扩展,能够轻松地将扩展额外存储或者增加外围设备。

Lichee Cluster 4A 还带有 BMC (带外管理),BMC 独立连接了每个 LM4A 的系统串口和复位引脚。BMC 可以从硬件上复位单个计算节点,还可以通过串口执行命令,比如执行 ser2net 或 kermit 来管理 Slot。

技术规格

支持的核心板 LM4A * 7
CPU RiscV C910@1.85GHz * 4 * 7
GPU IMG™ B 系列 BXM-4-64 * 7
NPU 4TOPS@INT8 * 7
RAM 最大 16GB * 7
EMMC 最大 128GB * 7
BMC SIPEED Lichee RV
电源管理 Sipeed M0 Sense
Ethernet 千兆以太网1(Slot#1)
千兆以太网2(交换机)
百兆以太网(BMC)
USB USB3.0 * 7 (LM4A)
USB2.0 * 1 (BMC)
HDMI HDMI * 1 (Slot 1)
SDCARD TF * 7
电源支持 支持 DC 口直流电源供电
支持 ATX 24PIN 电源
RTC 供电 CR2032 纽扣电池
散热 5V PWM 风扇接口 * 7
12V 4PIN PWM 风扇接口 * 1
尺寸 Mini ITX, 17 * 17 cm (6.7 * 6.7 inch)
可选配 MINI ITX 机箱, 20 * 12 * 22 cm

硬件系统

主板介绍

lc4a_top

主板框架图

lc4a_architecture

LicheeRV SOM(D1 C906@1GHz)有5个原生串口,以及两个USB串口,分别独立连接到了7个SOM上。

每个 LM4A 的 RST/BOOT 均可通过模拟开关进行控制。

1号LM4A默认引出了第二千兆口和HDMI口,方便该SOM进行整个集群的任务分发操作。

主板可通过12V DC充电头供电(推荐12V9A以上),或者使用标准ATX电源供电。

机箱介绍

推荐选配MINI-ITX机箱,该机箱具备良好的外观和散热性能,方便计算集群的部署展示。

机箱适配MINI-ITX主板,配备250W大功率电源,并安装了12cm静音风扇散热,可以保证CPU在满载运行时的温度低于70度。

lc4a_box

硬件安装指南

默认运输途中LC4A已经安装了所有SOM,如果你需要拆卸或者升级SOM,可以参考以下说明。

安装核心板

向两侧拉开白色锁扣,插入前请确认缺口为止,避免方向错误导致损坏

lc4a_install_goldfinger

放入核心板后均匀的向下施加压力

lc4a_install_install_lm4a

听到喀哒声后,确认白色锁扣正确扣上,安装完成。如果需要取出核心板,向两侧拉开白色锁扣即可。

lc4a_install_slot

安装BMC

安装烧录好镜像的SD卡到LicheeRV, 然后将LicheeRV的模块安装至交换机芯片旁边的座子,然后拧上螺丝.

插入电源

可选ATX电源供电或者DC电影供电。

确认ATX电源插座的卡扣已经扣紧,避免接触不良导致连接器升温

lc4a_power_atx20_cable

插上跳线帽

lc4a_power_jumpwire

网络连接

集群系统对外主要连接两个网口:1. 板载千兆交换机网口 2. BMC网口
板载千兆交换机网口建议连接入用户所在内网或者主网络,用于集群获取所需网络数据。
BMC网口建议连入独立网络进行集群控制,更具安全性。
集群内部通过千兆交换机连接。

如何获得集群的IP地址:

预装的固件安装启用了mdns服务
在你的PC上启用avahi服务(Linux)
使用mdns扫描整个网络获得lc4a的mdns域名信息:

avahi-browse -art | grep lc4a

然后使用:

ssh debin@lc4aXXXX.local

XXXX为mac地址后四位,用于区分每个slot

软件系统

LM4A镜像

集群中的LM4A SOM可以直接使用LicheePi4A的镜像.

如果需要使能USB,可以在Linux设备树中应用以下PATCH: 点我下载

或者直接使用预编译镜像:点我下载

镜像烧录方法:

  1. 按下BOOT按键的同时按一下RST按键,然后使用A TO A公头的USB线缆连接到电脑

  2. 使用fastboot工具烧录

OpenBMC镜像

主板上的 LicheeRV SOM 运行 OpenBMC 来管理主板上的 SOM。

镜像下载地址: 点我跳转

镜像烧录方法:

bmaptool copy obmc-phosphor-image-licheepi-rv.wic.gz /dev/YOUR_SDCARD

默认用户名: root

默认密码: 0penBmc

0 是零,不是 O

如果需要开发定制,请下载PATCH:

https://dl.sipeed.com/shareURL/LICHEE/LicheeCluster4A/04_Firmware/bmc/src

并应用到OpenBMC源码:

git clone https://github.com/openbmc/openbmc/
git checkout commit-id
git am xxx.patch

OpenBMC管理

从SSH访问Slot的串口:

ssh -p 2301 root@bmcip # access first slot's serial port
  • 端口 22: OpenBMC的shell

  • 端口 2301: slot1 的 SOL (Serial Over LAN)

  • 端口 2302: slot2 的 SOL

  • 端口 2303: slot3 的 SOL

  • 端口 2304: slot4 的 SOL

  • 端口 2305: slot5 的 SOL

  • 端口 2306: slot6 的 SOL

  • 端口 2307: slot7 的 SOL

每个Slot的串口输出到日志:

cat /var/log/obmc-cons*.log

对 LM4A 的电源管理:

启动/复位:(1-7 分别对应 slot 1 到 7)

/usr/libexec/phosphor-state-manager/muxctl.sh 1 boot
/usr/libexec/phosphor-state-manager/muxctl.sh 2 reset