2024-05-31

GIT管理

1.基本概念

1.git是通过ssh协议连接远程git服务器的，所以在登录ssh之前需要生成ssh密钥对将本地和远程git服务器连接起来：

打开终端（Linux或Mac）或Git Bash（Windows）。
输入命令 ssh-keygen -t rsa -b 4096 -C "your_email@example.com"，其中your_email@example.com替换为你的邮箱地址。
按照提示，选择密钥的保存位置和命名。
输入一个密码（可选），用于保护私钥的使用。

2.接下来配置ssh密钥，即将上一步产生的密钥添加到git服务器上，配置完成后，现在你可以通过SSH登录到Git服务器上的仓库了。

登录到Git服务器，在用户设置中找到SSH Keys的选项。
复制公钥文件id_rsa.pub的内容。
在SSH Keys的选项中，粘贴公钥内容并保存。

3.配置git客户端，让其使用SSH登录进行一次登录。可以按照以下步骤进行操作：

打开终端（Linux或Mac）或Git Bash（Windows）。
输入命令 git config --global user.name "Your Name"，将Your Name替换为你的用户名。
输入命令 git config --global user.email "your_email@example.com"，将your_email@example.com替换为你的邮箱地址。
输入命令 git config --global core.sshCommand "ssh -i ~/.ssh/id_rsa"，将~/.ssh/id_rsa替换为私钥的路径。

4.验证配置：

打开终端（Linux或Mac）或Git Bash（Windows）。
输入命令 ssh -T git@example.com，将git@example.com替换为你的Git服务器地址。
输入密码（如果设置了密码），如果出现欢迎信息，则表示SSH登录配置成功。

通过以上配置，我们能够使用Git客户端连接到Git服务器上的仓库，进行诸如克隆、推送、拉取等操作。

2.常用命令及使用大全

1.创建仓库：

git init：初始化一个git仓库
git clone <url>：clone一个git仓库

2.git config，我们可以通过git config来配置用户名和邮箱地址，便于我们将代码提交到远程仓库，具体格式如下：


git config --global user.name '你的用户名'
git config --global user.email '你的邮箱'

3.git add，git add 命令可将文件添加到缓存，如新项目中，添加所有文件很普遍，可以使用如下命令：


git add .

当然我们也可以指定某一类文件，如将java文件添加到缓存中，可以使用如下命令：


git add *.java

4.git status,我们可以使用 git status 命令来查看相关文件的状态，直接执行如下命令：


git status

5.git commit，git commit 将缓存区内容添加到仓库中，可以在后面加-m选项，以在命令行中提供提交注释，格式如下：


git commit -m "第一次版本提交"

如果你觉得每次 commit之前要add一下，想跳过add这一步，可以直接使用 -a选项,如：


git commit -am "第一次版本提交"

6.git branch,git branch可以查看分支，也可以创建分支，如果没有参数时，git branch会列出你在本地的分支；如果有参数时，git branch就会创建改参数的分支。如果要查看分支，命令格式如下：


git branch

当我们想创建分支时，可以在后面加参数，命令格式如下：


git branch  branchname

7.git checkout (branchname),git checkout可以切换分支，命令格式如下：


git checkout branchname

8.git merge,git merge命令可以将任意分支合并到到当前分支中去，命令格式如下：


git merge branchname

9.git branch -d (branchname),git branch -d可以删除分支，删除分支命令格式如下：


git branch -d (branchname)

10.git remote add,git remote add可以添加一个远程仓库，其命令格式如下：


git remote add [alias] [url]

参数[alias]为别名， [url]为远程仓库的地址，如：我们可以将https://github.com/qtqt/test.git

11.git remote,git remote可以查看当前有哪些远程仓库；

12.git fetch可以提取远程仓库的数据，如果有多个远程仓库，我们可以在后面加仓库的别名,git pull命令用于从另一个存储库或本地分支获取并集成(整合)，在默认模式下，git pull是git fetch后跟git merge FETCH_HEAD的缩写.

13.git push,git push 推送你的新分支与数据到某个远端仓库命令，格式如下：


git push -u [alias] [branch]

参数[alias]为别名， [branch]为远程仓库项目的分支；

14.git remote rm,git remote rm删除远程仓库，格式如下：


git remote rm [别名]

3.遇到过的报错

1.error: failed to push some refs to 'https://github.com/zzwcreator/chatglm_caption.git' 问题原因：远程库与本地库不一致造成的，在hint中也有提示把远程库同步到本地库就可以了解决办法：使用命令行：


git pull --rebase origin master

2024-05-06

Airbox开发

1.资料记录

Airbox账号密码：linaro

风扇太吵的话：


sudo busybox devmem 0x50029000 32 0x500
sudo busybox devmem 0x50029004 32 0xfa0

1.TPU-MLIR 快速入门手册： https://doc.sophgo.com/sdk-docs/v23.09.01-lts/docs_latest_release/docs/tpu-mlir/quick_start/html/01_introduction.html

2.示例模型仓库地址： https://github.com/sophon-ai-algo/examples

3.TPU-MLIR 官方仓库地址 https://github.com/sophgo/tpu-mlir

4.SOPHON-SAIL 开发手册： https://doc.sophgo.com/sdk-docs/v23.05.01/docs_latest_release/docs/sophon-sail/docs/zh/html/

5.TPU-MLIR 环境搭建与使用指南： https://www.sophgo.com/curriculum/description.html?category_id=43

6.LLM 的概念与实战（其次学习，让然后看看算能学院）： https://www.sophgo.com/curriculum/description.html?category_id=47

7.Airbox Demo 参考（首先参考复现）： https://zhengorange.github.io/airbox_wiki/

7.1刷机部署等： https://gitee.com/zilla0717/AirboxWiki/blob/master/README.md

8.算能开发者论坛： https://forum.sophgo.com

9.少林派开发板实战课程： https://www.sophgo.com/curriculum/description.html?category_id=6

10.sophoneSDK3开发指南 https://sophgo-doc.gitbook.io/sophonsdk3

请根据我对图像的文字描述，回答问题。问题：桌子上有什么？文字描述：'a screwdriver and tape measure on a table' 'a blue rectangular device with a red button' 'a screwdriver with a black handle' 'a close up of a machine' 'a yellow and black tape measure',

2.LLM概念与部署

1.SOPHON BM1684X介绍

SOPHON BM1684X是SOPHON专门针对深度学习领域推出的第四代张量处理器，具有32TOPS计算能力，支持32路高清硬件解码，12路高清硬件编码，适用于深度学习、计算机视觉、高性能计算等环境。

2.大模型训练过程、常见LLM与发展历程

Pre-train:从巨大的数据集中进行无监督训练，学习一般的语言模式和表征。
Fine-ture：根据特定的任务和更小的数据集训练和微调。

transformer模型分为encoder和decoder，都由注意力机制和FNN前馈神经网络(残差链接和归一化等等)组成。

常见LLM：

GPT-3:1750亿个参数decoder-only模型；
T5:文本对文本转化模型；
GLM130B:1300亿个参数的双语言的模型；

LLM的训练过程可以理解为对有效信息的无损压缩过程，压缩率约高，模型的智能水平越高，泛化能力约强，对任务的理解越好。

LLM模型的发展历程：

统计语言模型：对语句的概率分布进行建模，计算一个句子出现的概率或一句话是否合理的概率；
神经网络语言模型：循环神经网络RNN，LSTM, transformer模型；
预训练语言模型：指在大规模数据集上无监督学习得到通用的语言表示，通过微调可以用于下游任务，如ELMo模型，后来产生GPT系列；
大语言模型：数十亿参数，预训练+微调

3.大模型分类与压缩推理加速

根据大模型结构分类：只有encoder的模型，如BERT；有encoder和decoder的模型，如T5；只有decoder的模型，如GPT系列；实践证明只有decoder的模型效果更好。

模型压缩：

剪枝(非结构化剪枝和结构化剪枝)：减少不必要的参数或者权重链接；过程：训练->剪枝->微调；
量化(后训练量化和量化感知训练)：降低模型参数的准确率；进行一次FP32类型的数据可以执行四次FP8类型的数据；
知识蒸馏：训练一个更小的模型来模仿大模型的行为；过程：teacher-student setup建立大小模型->教师模型生成训练数据集也就是获得知识->学生模型训练；

LLM的训练和推理加速：

训练加速：data并行(分成batch放在不同的GPU上)、pipeline并行(模型分层分在不同GPU上)、tensor并行(矩阵分解，子矩阵在不同GPU上)；
推理加速：
1. KV Cache，不影响任何计算精度的前提下，通过空间换时间的思想，提高推理性能。
2. GPT类模型一次推理只输出一个token，输出token会与输入tokens拼接在一起作为下一次推理的输入，这样不断反复直到遇到终止符。
3. Flash-attention:重新排序注意力计算的算法，无需近似即可加速注意力并减少内存的占用。

3.TPU-MLIR环境构架你及使用指南

1.TPU-MLIR概念

TPU-MLIR是一种专用于处理器的TPU编译器。该编译器项目提供了一个完整的工具链，可以将来自不同深度学习框架(PyTorch, ONNX, TFLite和Caffe)的各种预训练神经网络模型转换为高效的模型文件(bmodel/cvimodel)，以便在SOPHON TPU上运行。通过量化到不同精度的bmodel/cvimodel，优化了模型在sophon计算TPU上的加速和性能。这使得可以将与对象检测、语义分割和对象跟踪相关的各种模型部署到底层硬件上以实现加速。

2.编译的概念(传统编译器与AI编译器)

传统的编译器是将高级编程语言编译为低级编程语言，比如机器码，组成与平台兼容的库或可执行文件；

Windows中有Microsoft Visual C++ (MSVC) 和 MinGW编译器；

Linux和MacOS中Clang,GNU Compiler Collection (GCC) 编译器；

传统编译器编译流程：

词法分析:将源代码分为词法单元(Tokens)；
语法分析:根据编程语言的语法，将Tokens组织成抽象语法树(Abstract Syntax Tree)；
语义分析:检查语法树，确保程序的合法性；
中间代码生成:将源代码转为与平台无关的中间代码；
优化:基于生成的中间代码进行各种优化提升程序性能或减少资源消耗；
目标代码生成:将中间代码转换为目标平台兼容的代码，生成可执行文件或库；
链接:链接多个目标文件和库文件，确保符号引用正常；

AI编译器是将深度神经网络编译为二进制模型，编译流程与传统编译器相似，区别在于将源代码转化为AI模型，词法单元转换为组成AI模型的算子，主要对AI模型进行优化(模型压缩、量化、算子融合等，减少计算量与存储需求，提高推理性能)；

3.SophonSDK

SophonSDK是算能科技基于其自主研发的AI芯片所定制的深度学习SDK，涵盖了神经网络推理阶段所需的模型优化、高效运行支持等能力，为深度学习应用开发和部署提供易用、高效的全栈式解决方案。

包含以下工具包：

tpu-nntc负责对第三方深度学习框架下训练得到的神经网络模型进行离线编译和优化，生成最终运行时需要的BModel。目前支持Caffe、Darknet、MXNet、ONNX、PyTorch、PaddlePaddle、TensorFlow等。
libsophon提供BMCV、BMRuntime、BMLib等库，用来驱动VPP、TPU等硬件，完成图像处理、张量运算、模型推理等操作，供用户进行深度学习应用开发。
sophon-mw封装了BM-OpenCV、BM-FFmpeg等库，用来驱动VPU、JPU等硬件，支持RTSP流、GB28181流的解析，视频图像编解码加速等，供用户进行深度学习应用开发。
sophon-sail 提供了支持Python/C++的高级接口，是对BMRuntime、BMCV、BMDecoder、BMLib等底层库接口的封装，供用户进行深度学习应用开发。
tpu-mlir为TPU编译器工程提供一套完整的工具链，可以将不同框架下预训练的神经网络，转化为可以在算能TPU上高效运行的二进制文件BModel。目前直接支持的框架包括tflite、onnx和Caffe。
tpu-perf为模型性能和精度验证提供了一套完整工具包。
tpu-kernel是芯片底层开发接口，既可以调用专用指令实现深度学习业务逻辑的加速，又可以调用通用指令实现客制的各种算法加速。

TPU-MLIR：Multi-Level Intermediate Representation,基于LLVM(Low-Level Virtual Machine)开发的编译器基础框架；统一IR(Intermediate Representation)格式，并通过多层IR提高通用与可复用性；扩展性与可组合性强，便于实现优化与代码生成；自带Tensor类型，目前主要用于深度学习领域；

模型转换需要在指定的docker执行,主要分两步,一是通过 model transform.py 将原始模型转换成mlir文件,二是通过 model_deploy.py 将mlir文件转换成bmodel.如果要转INT8模型,则需要调用 run_calibration.py生成校准表,然后传给 model_deploy.py。如果INT8模型不满足精度需要,可以调用run_qtable.py 生成量化表,用来决定哪些层采用浮点计算，然后传给 model_deploy.py 生成混精度模型。

4.AI编译器开发TPU-MLIR

1.AI编译器概念

作为框架和硬件之间的桥梁，深度学习编译器可以实现一次性代码开发和重用各种计算能力处理器的目标。算能也开源了自己开发的TPU编译工具——TPU-MLIR (Multi-Level Intermediate Representation)。TPU-MLIR是一个面向深度学习处理器的开源TPU编译器。该项目提供了完整的工具链，将各种框架下预训练的神经网络转换为可在TPU中高效运行的二进制文件bmodel，以实现更高效的推理。本课程以实际实践为驱动，引导您直观地理解、实践、掌握智能深度学习处理器的TPU编译框架。

2.MLIR代码由来

AI模型代码编译到特定硬件可以使用的二进制的模型bmodel，需要先编译为中间代码IR(在该步骤中完成优化)，其复杂度介于高级编程语言与低级机器码之间。

需要多层IR进行转换(Dialect的概念),(实现TPU-MLIR的核心概念)

Dialect组成：

Prefix：Dialect名称，如top层、Tpu层；
Operations：一系列操作，每个操作对应深度学习模型中的单个算子，如ConvOp;
Passes：Dialect内的转换，如Top层的图优化；Dialect内的转换，如Top层lower到Tpu层；

MLIR文本代码组成：

ModuleOP:当前代码本身；
FuncOp:其中的main Func表示代码的整体运行逻辑；其他Func可能是在代码中多次出现的具有固定顺序的操作集，封装起来反复调用；
Block:一个Func的所有内容，一些操作的集合；

MLIR文本代码解释：

以百分号%开头的语句代表一个operation，进行tensor的操作；MLIR中两个类来完成operation的实现：operation class(通用的定义操作，提供通用的属性和操作接口，如operation的创建删除移动等)和op class(用于派生某个Dialect下的具体算子);
Value表示操作数，表示operation的输入和输出；主要有两个派生类：BlockArgument类(某个Block的输入参数)和OpResult类(静态单赋值的结果)；
type表示操作数的类型；通常是Tpye类和ShapeType类的继承类TensorType类
attribute：零个或多个元素的字典，这些属性是始终恒定的操作数；

MLIR中Op的定义方式：

直接在C++中定义：需要继承Op基类并重写部分构造函数，代码冗余可读性差；
在MLIR中的ODS(Operation Definition Specification)中定义：在td文件中编写Op定义，利用LLVM提供的TableGen语言进行定义，容易直观；

3.MLIR编译流程：

将其他模型Pytorch/Tensorflow/PaddlePaddle转换为ONNX模型(提供了丰富的算子和一些基础的暑假类型，通过多个node来定义计算图。)；
Top层：ONNX->Top MLIR(称为前端转换),主要将onnx模型转化为origin.mlir和canonicalize操作，即算子融合、计算简化等，和硬件无关；代码在./tpu-mlir/python/transform中;
Lowering操作：将Top Dialect转化为TPU Dialect(表示TPU芯片的Kernel库)，代码在./tpu-mlir/lib/Conversion/TopToTpu;包含量化操作，F32/BF16/16是直接截取的量化方式，int8量化是基于校准信息的一种量化方式，用8位整型映射32位浮点型，使用数据集校准调优，也有混合精度的方式；
LayerGroup+AddressAssign操作(硬件层的优化，如算子融合和内存分配优化)，代码在./tpu-mlir/lib/Dialect/Tpu/Transforms;
Code Generation:目录./tpu-mlir/lib/Dialect/Tpu/Interfaces下包含不同芯片算子生成的机制，目录./tpu-mlir/lib/Backend下记录了根据不同芯片规格相应的实现，目录./tpu-mlir/third_party/nntoolchain/lib/引入了外部的动态库(后端算子具体实现)调用芯片底层的配置，最后生成了在TPU上运行的指令；
模型编译过程中也涉及到Correctness check保证编译得到的bmodel模型性能不会下降太多。

4.两种量化方式：

训练后量化：训练完成后量化，无需或仅需要少量的数据，易于实现；
1. 训练后量化方式：
2. 均匀量化用的比较多，分为对称量化(分为有符号和无符号两种)和非对称量化：
4. 在weight tensor容易得到max，min, threshold，但对于激活tensor根据输入的数值改变，此时确定这三个值就要用到校准环节；
6. KL散度衡量两个数据分布的相似性，TensorRT在量化过程中也用到了。
量化感知训练：在训练过程中模拟量化重新训练模型，需要带标签的数据，量化后更接近F32模型的精度；在训练过程中插入伪量化算子，将weight与activation量化成低位精度再反量化回FP32引入量化误差。

MLIR实战

Pattern Rewriting Framework: 有向无环图DAG to 有向无环图DAG转换，

分为： Pattern Definition Pattern Rewriter Pattern Application

Dialect1转换为Dialect2通过Dialect Conversion组件进行转换

TPU原理：一个完整的TPU包含多个Lane；每个Lane包含Local memory(存储要运算的数据) 和 Execution Units(TPU上最小的计算单元)；

指令：GDMA(数据搬运)、BDC(运算)、其他HAU.

6.智能多媒体与TPU编程实战

1.基本概念

智能多媒体关键技术：编解码技术、图像处理技术、多媒体通信技术；智能多媒体关键指标：解码路数、帧率、分辨率、图像处理接口丰富度、延迟、协议支持；

2.图像处理技术

空间分辨率：

1080P，其中P是“逐行扫描”，表示视频在宽高比为16:9的情况下，视频总共有1080行像素数；
2K，表示视频中每一帧图像的列像素数在2K的级别；
通常所说的几百万像素，指的是图像的总像素，即M×N的总数到几百万；

量化：亮度的分辨率，衡量图像亮度的量化精度；

位深：表示图像中每个像素用多少个二进制位表示，灰度图通常是8位，彩色图像通常是24位；

帧率：表示视频中每秒包含的图像数；

码率：是数据传输时单位时间传送的数据比特数，单位是千比特每秒，码率kbps = 文件大小(KB) * 8/时间(s)，越高每秒显示的帧数越多；

PSNR：峰值信噪比，常用于两幅图像相似度的测量，基于统计误差衡量，越大含有信息越多，统计意义上两图之间的差异越小，相似度越高；

色彩空间模型(可以相互转换)：

RGB模型：R G B三基色混合，每个颜色值用8bit表示(真彩色)，RGB555是16位的RGB格式，每个分量用5位表示，还有RGB565模型；
HSI模型：色度H、饱和度S、亮度I组成；

3. YUV模型：亮度Y、色度UV(CbCr)组成，表示对蓝色和对红色的便宜程度；

图像存储格式：

BMP格式：采用位映射存储方式，与硬件设备无关除了色彩分辨率可选之外，不采用其他任何压缩-扫描格式是按从左到右、从上到下的顺序；
GIF格式：种连续色调的无损压缩格式，压缩率在50%左右存储量相对小，成像清晰，适合于初期的互联网；
PNG格式：便携式网络图像格式--存储量相对小，压缩比高；
JPEG格式：采用有损压缩方式去除图像数据中的冗余信息可以在获取极高的压缩率的同时保持图像质量；

图像增强：

空间域增强：灰度变换、代数运算、空间域滤波，直接对图像中像素的灰度级进行操作；
频域增强：频域滤波，对图像进行傅里叶变换等；

直方图：横坐标表示灰度级，纵坐标表示该灰度级出现的频数(越均匀图像最清晰)；

边缘检测，边缘就是像素变化比较明显的区域(一阶导数极致的取区域，通常用一阶差分表示，对于二维图像，通常用梯度来检测)，具有丰富的语义信息；

根据不同的卷积核对原图像做卷积可以实现很多图像的基本处理；

对于原信号有噪声的话，可以先滤波，如高斯降噪(可以用高斯滤波卷积核)；

在精度要求不高时，Sobel是最常用的边缘检测算子(对高斯核求导再与原图像卷积)，缺点是边缘出现了好几个像素，不是只有一个像素值；

Canny边缘检测流程：

高斯平滑滤波
计算梯度
非极大值抑制(NMS)
双阈值

3.图像视频编码技术

为什么需要编码：一个高清视频存在空间冗余(帧内)、时间冗余(帧间)、心理视觉冗余(人眼对色度不敏感对亮度敏感)、编码冗余(可以用熵编码)；

涉及的三个技术：预测编码、变换编码、熵编码；

JPEG编码主要步骤：

图像预处理，进行颜色空间转换和分块；
零偏置电平下移，0-255转为-128到127；
8x8分块 DCT变换；
量化；
编码；

H.264编码标准：

帧内预测：分块，对于亮度，预测块可以有4×4和16×16两种尺寸吗，每种尺寸都有好几种预测方式(9和4种)，可以从各个方向来预测，计算代价，选择最优的分块尺寸和预测方式；
帧间预测：运动估计(块搜索)，也可以在亚像素下进行估计，多参考帧方法；
变换编码：引入4×4整数DCT(仅次于KL变换的最优正交变换)变换降低了算法的复杂度，将带有小数的系数放到量化哪里去操作(硬件不好实现带有小数的运算)；
去块滤波器(对块做平滑操作(真假边界判定))，在解码的时候使用；
熵编码，H.264标准规定的熵编码有两种:一种是可变长编码方案，包括统一的变长编码(UVLC)和基于上下文的自适应变长编码(CAVLC);另一种是基于上下文的自适应二进制算术编码(CABAC)。这两种方案都利用上下文信息，使编码最大限度地利用了视频流的统计信息，有效降低了编码冗余；

H.265编码标准：

帧内预测：分块有64×64、32×32、16×16、8×8，最多有35种预测模式，编码结构CTU；
帧间预测：
变换与量化：
环路滤波：去块滤波和自适应样点补偿；
熵编码：只有一种熵编码：CABAC算数编码(用一段表示一个序列)，是上下文自适应编码；

4.智能多媒体通信技术

与多媒体相关的通信技术，包括TCP/IP、UDP、RTP/RTCP、RTSP、RTMP以及多媒体通信协议的应用开发技术。

数字视频接口类型：

SDI(Serial Digital Interface)接口，是一种广播级的高清数字输入和输出端口，常用于广播电视的摄像机接口，采用BNC接口的同轴电缆，传输非压缩的SDI信号，单线缆最多支持4Kp60标准，传输8K需要4根12G-SDI线缆，线长最多150m；
USB接口：USB3.0速度可达350MB/s，但线长一般控制3m以内，不超过5m；
HDMI接口：数字高清多媒体接口，最大传输贷款48.0Gbps，可以同时发送音频和视频信号，支持4K，即插即用，无需安装驱动，而DP接口传输速度更快，线长不超过5m；
GigE接口：千兆网口1000Mbps，用作高速、大数据量的图像传输，一般用来对千兆工业相机进行采集，图像数据一般是未压缩过的，上位机需要相应的千兆网卡进行接收，线长最多100m；
普通IP口，100Mbps，线长最长100m，不需要采集卡，传输的是压缩的数据；

无线传输：

WIFI：覆盖范围小于100m，速度54Mbit/s；
微波：无线电波，传输距离可达几十公里，频段一般是902-928MHz，一般选用跳频数字电台实现无线遥控；
LTE(如大疆无人机)
5G：经过编码压缩后传输到互联网；
卫星：一般是负责将演播室或现场转播系统制作完成的基带节卫星传输，常用于播出链路，目信号，通过地面卫星车内编码器压缩编码后，再通过卫星链路实现上行转发。

TCP与UDP： TCP三次握手、四次挥手还有拥塞控制(慢启动快恢复)；

RTP(Real-time Transport Protocol)与RTCP(Real-time Transport Control Protocol)：通常基于UDP协议又做了一层控制，工作于应用层和传输层之间，适用于封装要实时传输数据的应用，如视频音频模拟数据等，RTCP提供拥塞控制流量控制等(在接收端会反馈报文的损失给发送端进而调整发送速度)；

RTSP(Real Time Streaming Protocol)协议：控制分组基于TCP传输，数据分组基于UDP传输，是双向的，可以发可以拉；

RTMP(Real Time Messaging Protocol)：设计用来实时数据通信，基于TCP，多用于直播领域，默认使用端口1935，一般传输的是flv、f4v格式流，延迟在1-3s；

GB28181：国家推进的标准协议，由公安部科技信息化局提出，联网系统在进行视音频传输及控制时应建立两个传输通道:会话通道和媒体流通道。会话通道用于在设备之间建立会话并传输系统控制命令，会话协议采用SIP协议(RFC3261);媒体流通道用于传输视音频数据，经过压缩编码的视音频流采用流媒体协议RTP/RTCP传输。会话协议实现的功能主要包括:注册、心跳保活、目录查询、实时视频点播、录像查询、录像回放/下载、报警事件上报、网络校时、事件订阅等；

嵌入式AI多媒体开发架构

嵌入式AI通过底层多媒体处理接口向算法侧提供API接口，如OpenCV、FFMpeg、BMCV接口，这些接口用于对视频图像编解码、图像的基本处理如色彩空间变换、尺度变换、仿射变换等。

BMCV：自有图像处理加速接口，提供硬件加速的图像处理功能；

FFMPEG：开源音视频及图像处理接口(音视频编解码人员最熟悉的开源框架，提供硬件加速的H264/HEVC视频编解码，JPEG编解码，图像加速功能，所有软件支持的视频/图像编解码接口(即所有 FFMPEG 开源支持的格式)；
OPENCV：开源计算机视觉库(计算机视觉工程师最常用的开源框架)，封装 FFMPEG 提供硬件加速的视频编解码接口，提供硬件加速的 JPEG 编解码接口，保留原有的软件支持的图像处理功能，注意:在视频编解码上，OPENCV只是对 FFMPEG 接口的一层封装；

两种工作模式：

SOC模式：AI芯片中的处理器作为主控CPU，可独立运行应用程序，通过cache同步系统内存和设备内存(物理上指向同一块内存)；
PCIE模式：以PCIE板卡形态插到服务器主机应用程序在服务器CPU上运行，系统内存是服务器操作系统的虚拟内存空间，设备内存是PCIE板卡上的物理内存空间，在物理上是两块内存，通过PCIE同步；

2024-04-23

C语言

1.常见使用


int i; // 整数类型变量，通常为32位（4字节）
short s; // 短整数类型变量，通常为16位（2字节）
long l; // 长整数类型变量，通常为32位或64位（4或8字节）
short int i1; // 等同于 short s; ，为16位（2字节）
long int i2; // 等同于 long l; ，为32位或64位（4或8字节）
unsigned int i3; // 无符号整数类型变量，通常为32位（4字节）
signed int i4; // 有符号整数类型变量，通常为32位（4字节）
unsigned u; // 无符号整数类型变量，大小取决于系统（一般为4字节）
signed s1; // 有符号整数类型变量，大小取决于系统（一般为4字节）
unsigned short us; // 无符号短整数类型变量，通常为16位（2字节）
总结：
int、unsigned int、signed int 通常为4字节；
short、unsigned short 通常为2字节；
long、long int 一般为4或8字节，取决于编译环境；
字节大小可能因编译环境、操作系统和编译器的不同而有所变化。

c++
#include<stdio.h>

// 定义链表
struct ListNode{
    int name;
    char b;
    char c[10];
    struct ListNode* next;
};

int main(){
    int a;
    char b;
    char str[10] = "zzwxxy";
    char str2[10];

    printf("please input string\n");
    gets(str2);
    printf("input string is:\n%s", str2);
}

/*
 * 定义字符串方式
char string[] = "zhang";
char string[] = {'z','h','a','n','g'};
char str[] = {“zhang”};
*/

/*
scanf和gets的区别：
使用方法：scanf("%s", str2);  gets(str2);
scanf ：当遇到回车，空格和tab键会自动在字符串后面添加’\0’，但是回车，空格和tab键仍会留在输入的缓冲区中。
gets：可接受回车键之前输入的所有字符，并用’\0’替代 ‘\n’.回车键不会留在输入缓冲区中

printf()和puts()的区别: 
printf("input string is:\n%s", str2);  和  puts(str2);
*/

2.链表定义及操作

c++
#include <stdio.h>
#include <stdlib.h>
struct  Node
{
   int data;
   struct Node* next;
};
struct Node* head;

// 在链表头节点插入一个值为x的节点
void Insert(int x){
   struct Node* temp = (struct Node*)malloc(sizeof(struct Node));
   temp->data = x;
   temp->next = head;
   // if(head != NULL)temp->next = head;
   head = temp;
}

// 迭代法实现反转列表
struct Node* Reverse1(struct Node* head){
   struct Node *Current,*Prev,*next;
   Current = head;
   Prev = NULL;
   while(Current != NULL){
      next = Current->next;
      Current->next = Prev;
      Prev = Current;
      Current = next;
   }
   head = Prev;
   return head;
}

// 递归法实现反转列表
void Reverse2(struct Node* p){
   if(p->next ==NULL){
      head = p;
      return;
   }
   Reverse2(p->next);
   struct Node* q = p->next;
   q->next = p;
   p->next = NULL;
}

// 链表内指定区间反转  调试好了
struct Node* reverseBetween(struct Node* head, int m, int n ) {
    // write code here
    if(head == NULL)return head;
    if(head->next == NULL)return head;
    if(m == n)return head;
    struct Node *Current,*Prev,*next,*start,*start_last;
    int i;
    Current = head;
    Prev = NULL;
    next = NULL;
    // 先找到开始位置
    for (i=1; i<m; i++) {
        next = Current->next;
        // Current->next = Prev;
        Prev = Current;
        Current = next;
    }
    // 标记
    start_last = Prev;
    start = Current;
    // 反转
    for (i=0; i<(n-m+1); i++) {
        next = Current->next;
        Current->next = Prev;
        Prev = Current;
        Current = next;
    }
    // 头尾节点重指向
    if(start != head){
        start->next = next;
        start_last->next = Prev;//start!=head的情况下，需要保留start上一个指针
    }
    else {
        start->next = next;
        head = Prev;//start==head的情况下，直接将head指向待反转的最后一个
    }
    return head;
}

//打印链表的所有值
void Print(){
   struct Node* temp = head;
   printf("List is:");
   while(temp){
      printf("%d",temp->data);
      temp = temp->next;
   }
   printf("\n");
}

void Print2(struct Node*p){
   if(p ==NULL){
      printf("\n");
      return;
   }
   // 正序打印
   // printf("%d",p->data);
   // Print2(p->next);

   // 反转打印
   printf("%d",p->data);
   Print2(p->next);
}

int main(){
   head = NULL;
   int n,x,i;
   printf("Please input the number of node:\n");
   scanf("%d",&n);
   for(i = 0;i<n;i++){
      printf("Please input the value of Node:\n");
      scanf("%d",&x);
      Insert(x);
      Print();
   }
   head = Reverse1(head);
   printf("Reverse linked list is:\n");
   Print();

   Reverse2(head);
   printf("Reverse linked list is:\n");
   Print();
   
   // head = reverseBetween(head,2,4);
   // Print();

   // printf("Print2 linked list is:\n");
   // Print2(head);

   // char name[100];
   // printf("What is your name?\n");
   // scanf("%s",name);
   // printf("Hello,%s,nice to meet you!\n",name);
}

3.各种排序算法C语言

c++
#include <stdio.h>

// 1.插入排序，时间复杂度O(n2)，空间复杂度O(1)
void InsertSort(int a[], int n)
{
    for (int i = 1; i < n; i++)
    {
        // 若第i个元素大于i-1元素，直接插入。小于的话，移动有序表后插入
        if (a[i] < a[i - 1])
        {
            int j = i - 1;
            // 复制为哨兵，即存储待排序元素
            int x = a[i];
            // 先后移一个元素
            a[i] = a[i - 1];
            // 查找在有序表的插入位置
            while (x < a[j])
            {
                a[j + 1] = a[j];
                // 元素后移
                j--;
            }
            // 插入到正确位置
            a[j + 1] = x;
        }
    }
}

// 2.希尔排序,时间复杂度O(N^1.5),空间复杂度O(1)
void ShellInsertSort(int a[], int n, int dk)
{
    for (int i = dk; i < n; ++i)
    {
        if (a[i] < a[i - dk])
        { // 若第i个元素大于i-1元素，直接插入。小于的话，移动有序表后插入
            int j = i - dk;
            int x = a[i];     // 复制为哨兵，即存储待排序元素
            a[i] = a[i - dk]; // 首先后移一个元素
            while (j >= 0 && x < a[j])
            { // 查找在有序表的插入位置
                a[j + dk] = a[j];
                j -= dk; // 元素后移
            }
            a[j + dk] = x; // 插入到正确位置
        }
    }
}
void ShellSort(int a[], int n)
{

    int dk = n / 2;
    while (dk >= 1)
    {
        ShellInsertSort(a, n, dk);
        dk = dk / 2;
    }
}

// 选择排序,时间复杂度：O(N^2), 空间复杂度：O(1)
int SelectMinKey(int a[], int n, int i)
{
    int k = i;
    for (int j = i + 1; j < n; ++j)
    {
        if (a[k] > a[j])
            k = j;
    }
    return k;
}
void SelectSort(int a[], int n)
{
    int key, tmp;
    for (int i = 0; i < n - 1; ++i)
    {
        key = SelectMinKey(a, n, i); // 选择最小的元素
        if (key != i)
        {
            tmp = a[i];
            a[i] = a[key];
            a[key] = tmp; // 最小元素与第i位置元素互换
        }
    }
}

// 堆排序,时间复杂度：O(N*logN),空间复杂度：O(1)
void HeapAdjust(int H[], int s, int length)
{
    int tmp = H[s];
    int child = 2 * s + 1; // 左孩子结点的位置。(i+1 为当前调整结点的右孩子结点的位置)
    while (child < length)
    {
        if (child + 1 < length && H[child] < H[child + 1])
        { // 如果右孩子大于左孩子(找到比当前待调整结点大的孩子结点)
            ++child;
        }
        if (H[s] < H[child])
        {                    // 如果较大的子结点大于父结点
            H[s] = H[child]; // 那么把较大的子结点往上移动，替换它的父结点
            s = child;       // 重新设置s ,即待调整的下一个结点的位置
            child = 2 * s + 1;
        }
        else
        { // 如果当前待调整结点大于它的左右孩子，则不需要调整，直接退出
            break;
        }
        H[s] = tmp; // 当前待调整的结点放到比其大的孩子结点位置上
    }
}

/**
 * 初始堆进行调整
 * 将H[0..length-1]建成堆
 * 调整完之后第一个元素是序列的最小的元素
 */
void BuildingHeap(int H[], int length)
{
    // 最后一个有孩子的节点的位置 i=  (length -1) / 2
    for (int i = (length - 1) / 2; i >= 0; --i)
        HeapAdjust(H, i, length);
}
/**
 * 堆排序算法
 */
void HeapSort(int H[], int length)
{
    // 初始堆
    BuildingHeap(H, length);
    // 从最后一个元素开始对序列进行调整
    for (int i = length - 1; i > 0; --i)
    {
        // 交换堆顶元素H[0]和堆中最后一个元素
        int temp = H[i];
        H[i] = H[0];
        H[0] = temp;
        // 每次交换堆顶元素和堆中最后一个元素之后，都要对堆进行调整
        HeapAdjust(H, 0, i);
    }
}

// 冒泡排序,时间复杂度：O(N^2),空间复杂度：O(1)
void BubbleSort(int r[], int n)
{
    int low = 0;
    int high = n - 1; // 设置变量的初始值
    int tmp, j;
    while (low < high)
    {
        for (j = low; j < high; ++j) // 正向冒泡,找到最大者
            if (r[j] > r[j + 1])
            {
                tmp = r[j];
                r[j] = r[j + 1];
                r[j + 1] = tmp;
            }
        --high;                      // 修改high值, 前移一位
        for (j = high; j > low; --j) // 反向冒泡,找到最小者
            if (r[j] < r[j - 1])
            {
                tmp = r[j];
                r[j] = r[j - 1];
                r[j - 1] = tmp;
            }
        ++low; // 修改low值,后移一位
    }
}

// 快速排序递归实现,时间复杂度：O(N*logN), 空间复杂度：O(logN)
int QuickSort(int *a, int low, int high)
{
    int i = low;    // 第一位
    int j = high;   // 最后一位
    int key = a[i]; // 将第一个数作为基准值-- 先找到一个基准值

    while (i < j)
    {
        while (i < j && a[j] >= key)
        {
            j--;
        }
        a[i] = a[j];

        while (i < j && a[i] <= key)
        {
            i++;
        }
        a[j] = a[i];
    }
    a[i] = key;
    if (i - 1 > low)
    {
        QuickSort(a, low, i - 1);
    }

    if (i + 1 < high)
    {
        QuickSort(a, i + 1, high);
    }

    return 0;
}

// 归并排序迭代实现,时间复杂度：O(N*logN), 空间复杂度：O(N)
void merge(int arr[], int start, int mid, int end, int len)
{
    int result[len];
    int k = 0;
    int i = start;
    int j = mid + 1;
    while (i <= mid && j <= end)
    {
        if (arr[i] < arr[j])
        {
            result[k++] = arr[i++];
        }
        else
        {
            result[k++] = arr[j++];
        }
    }
    if (i == mid + 1)
    {
        while (j <= end)
            result[k++] = arr[j++];
    }
    if (j == end + 1)
    {
        while (i <= mid)
            result[k++] = arr[i++];
    }
    for (j = 0, i = start; j < k; i++, j++)
    {
        arr[i] = result[j];
    }
}

void MergeSort(int arr[], int start, int end, int len)
{
    if (start >= end)
        return;
    int mid = (start + end) / 2;
    MergeSort(arr, start, mid, len);
    MergeSort(arr, mid + 1, end, len);
    merge(arr, start, mid, end, len);
}

int main()
{
    int i;
    int array[] = {9, 5, 6, 1, 4, 7, 3, 8, 2};
    int array2[9];
    // InsertSort(array, sizeof(array)/sizeof(array[0]));
    // ShellSort(array, sizeof(array)/sizeof(array[0]));
    // SelectSort(array, sizeof(array)/sizeof(array[0]));
    // HeapSort(array, sizeof(array)/sizeof(array[0]));
    // BubbleSort(array, sizeof(array)/sizeof(array[0]));
    // QuickSort(array, 0, 9-1);
    int len = sizeof(array) / sizeof(array[0]);
    MergeSort(array, 0, 9 - 1, len);

    printf("sort result is:");
    for (i = 0; i < 9; i++)
    {
        printf("%d", array[i]);
    }
    return 0;
}

4.二叉搜索树

c++
#include <stdio.h>
#include <stdlib.h>
#include <stdbool.h>
struct BstNode
{
   int data;
   struct BstNode *left;
   struct BstNode *right;
};

struct BstNode *GetNewNode(int data)
{
   struct BstNode *temp = (struct BstNode *)malloc(sizeof(struct BstNode));
   temp->data = data;
   temp->left = NULL;
   temp->right = NULL;
   return temp;
}

// 在二叉搜索树中插入一个节点
struct BstNode *Insert(struct BstNode *root, int data)
{
   if (root == NULL)
   {
      root = GetNewNode(data);
   }
   else if (data <= root->data)
   {
      root->left = Insert(root->left, data);
   }
   else
   {
      root->right = Insert(root->right, data);
   }
   return root;
}

// 在二叉搜索树中搜索一个节点
bool Search(struct BstNode *root, int data)
{
   if (root == NULL)
      return false;
   else if (root->data == data)
      return true;
   else if (data <= root->data)
      return Search(root->left, data);
   else
      return Search(root->right, data);
}

// 二叉搜索树的最小值
int FindMin(struct BstNode *root)
{
   struct BstNode *temp = root;
   if (temp == NULL)
   {
      printf("root is empty\n");
      return -1;
   }
   else
   {
      while (temp->left != NULL)
      {
         temp = temp->left;
      }
      return temp->data;
   }
}

// 二叉搜索树的最大值
int FindMax(struct BstNode *root)
{
   struct BstNode *temp = root;
   if (temp == NULL)
   {
      printf("root is empty\n");
      return -1;
   }
   else
   {
      while (temp->right != NULL)
      {
         temp = temp->right;
      }
      return temp->data;
   }
}
// 二叉搜索树的前序遍历
void Preorder(struct BstNode *root)
{
   if (root == NULL)
      return;
   printf("%d,", root->data);
   Preorder(root->left);
   Preorder(root->right);
}
// 二叉搜索树的中序遍历
void Inorder(struct BstNode *root)
{
   if (root == NULL)
      return;
   Inorder(root->left);
   printf("%d,", root->data);
   Inorder(root->right);
}
// 二叉搜索树的后序遍历
void Poseorder(struct BstNode *root)
{
   if (root == NULL)
      return;
   Poseorder(root->left);
   Poseorder(root->right);
   printf("%d,", root->data);
}

// 判断是否是二叉搜索树
bool IsSubtreeLesser(struct BstNode *root, int data)
{
   if (root == NULL)
      return true;
   if (root->data <= data && IsSubtreeLesser(root->left, data) && IsSubtreeLesser(root->right, data))
      return true;
   else
      return false;
}
bool IsSubtreeGreater(struct BstNode *root, int data)
{
   if (root == NULL)
      return true;
   if (root->data >= data && IsSubtreeGreater(root->left, data) && IsSubtreeGreater(root->right, data))
      return true;
   else
      return false;
}
bool IsBinarySearchTree(struct BstNode *root)
{
   if (root == NULL)
      return true;
   if (IsSubtreeLesser(root->left, root->data) && IsSubtreeGreater(root->right, root->data) && IsBinarySearchTree(root->left) && IsBinarySearchTree(root->right))
      return true;
   else
      return false;
}
// 二叉搜索树的高度
int FindHeight(struct BstNode *root)
{
   int LeftHeight = 0;
   int RightHeight = 0;
   if (root == NULL)
   {
      return -1;
   }
   LeftHeight = FindHeight(root->left);
   RightHeight = FindHeight(root->right);
   if (LeftHeight >= RightHeight)
      return LeftHeight + 1;
   else
      return RightHeight + 1;
}

int main()
{
   struct BstNode *root = NULL;
   printf("input start!\n");
   root = Insert(root, 10);
   root = Insert(root, 8);
   root = Insert(root, 7);
   root = Insert(root, 10);
   root = Insert(root, 35);
   root = Insert(root, 50);
   printf("input yes!\n");
   printf("%d", FindHeight(root));
   // Inorder(root);

   // if(IsBinarySearchTree(root) == true)printf("This is IsBinarySearchTree");
   // else printf("This is not IsBinarySearchTree");
   // if(Search(root,30) == true)printf("Found!\n");
   // else printf("Not Found!\n");

   // printf("%d\n",FindMax(root));
   // printf("%d",FindMin(root));
}

C++语言

1.常见操作

c++
#include<iostream>
#include <cstring> 
#include <string> 
using namespace std;  // 为了使用cin和cout

// 定义链表
struct ListNode
{
    int a;
    string name;
    char c;
    ListNode* next;
};

ListNode *head;

int main(){
    int a;
    char b;
    char c[8];
    string d;
    cout<<"please input string"<<endl;
    getline(cin, d);
    cout<<d<<endl;
    return 0;
}

/*
#include <cstring> 的作用：
可以使用string定义字符串
可以使用strlen获得字符串(字符串需要使用char s[10])定义的长度
int strcmp(const char *s1, const char *s2);当s1<s2时，返回为负数；当s1=s2时，返回值= 0；当s1>s2时，返回正数。
*/

/*
cin和getline的区别：
cin>>str不会读取空格； getline(cin, str); 可以读取空格，但是需要#include <string> 并且str需要通过 string定义；
*/

2.各种排序算法C++


/*
 *冒泡排序,时间复杂度O(N^2)；空间复杂度：O(1)；稳定排序
 *思路：第一趟：两两元素相比，前一个比后一个大就交换，直到将最大的元素交换到末尾位置；一共进行n-1趟这样的交换将可以把所有的元素排好。

 *插入排序，时间复杂度O(N^2)；空间复杂度O(1)；稳定排序
 *思路：假设数组除最后一个元素都有序了，那么将最后一个元素与前面的比较，如果前面的元素大则向右移动。实际过程从数组的第二个元素开始执行插入排序

 *希尔排序，时间复杂度O(N^1.5)；空间复杂度O(1)；不稳定排序。
 *思路：先选定一个整数gap，把待排序文件中所有记录分成gap个组，所有距离为gap的记录分在同一组内，并对每一组内的元素进行排序。然后将gap逐渐减小重复上述分组和排序的工作。当到达gap=1时，所有元素在统一组内排好序。
 
 *选择排序，时间复杂度O(N^2); 空间复杂度O(1);不稳定排序。
 *思路：第一次从待排序的数据元素中选出最小（或最大）的一个元素，存放在序列的起始(末尾)位置，然后选出次小(或次大)的一个元素，存放在最大(最小)元素的下一个位置，重复这样的步骤直到全部待排序的数据元素排完。优化：每次最大和最小同时选.

 *堆排序，时间复杂度O(N*logN)；空间复杂度O(1)；不稳定排序。
 *思路：升序为例，构建一个堆结构，然后每个父节点均替换为子节点的最大值，然后根节点就是最大值，重复这个步骤。

 *快速排序，时间复杂度O(N*logN)；空间复杂度O(logN)；不稳定排序。
 *思路：最右边的值为基准值，按照该排序码将待排序集合分割成两子序列，左子序列中所有元素均小于基准值，右子序列中所有元素均大于基准值，然后最左右子序列重复该过程，直到所有元素都排列在相应位置上为止。确定两个指针left 和right 分别从左边和右边向中间遍历数组。如果选最右边为基准值，那么left指针先走，如果遇到大于基准值的数就停下来。然后右边的指针再走，遇到小于基准值的数就停下来。交换left和right指针对应位置的值。重复以上步骤，直到left = right ，最后将基准值与left(right)位置的值交换。

 *归并排序，递归实现，时间复杂度O(N*logN)；空间复杂度O(N)；稳定排序。
 *思路：采用分治法，将已有序的子序列合并，得到完全有序的序列；即先使每个子序列有序，再使子序列段间有序。

c++
#include<iostream>
using namespace std;

int len = 10;
int a[10] = {5,7,2,6,4,1,3,9,8,10};

/*
 *冒泡排序,时间复杂度O(N^2)；空间复杂度：O(1)；稳定排序
 *思路：第一趟：两两元素相比，前一个比后一个大就交换，直到将最大的元素交换到末尾位置；一共进行n-1趟这样的交换将可以把所有的元素排好。
*/
void MaoPao(int a[]){
    int temp;
    int flag = 0;
    // n-1趟排序
    for(int i = 0; i < len - 1; i++){
        for(int j = 0; j < len - 1 -i; j++){
            if(a[j] > a[j + 1]){
                temp = a[j];
                a[j] = a[j + 1];
                a[j + 1] = temp;
                flag = 1;
            }
        }
        // 若某一趟排序中没有元素交换则说明所有元素已经有序，不需要再排序
        if(flag == 0)break;
    }
}

/*
 *插入排序，时间复杂度O(N^2)；空间复杂度O(1)；稳定排序
 *思路：假设数组除最后一个元素都有序了，那么将最后一个元素与前面的比较，如果前面的元素大则向右移动。实际过程从数组的第二个元素开始执行插入排序
*/
void ChaRu(int a[]){
    // 从第一轮就从第二个元素开始找，所以n-1轮就可以
    for(int i = 0; i < len - 1; i++){
        // 已经有序的最后一个元素
        int end = i;
        // 需要排序的元素
        int temp = a[end + 1];
        while(end >= 0){
            if(a[end] > temp){
                // 直接替换 循环外面再将被替换的值放到适当位置
                a[end + 1] = a[end];
                end--;
            }
            else{
                break;
            }
        }
        a[end + 1] = temp;
    }
}

/*
 *希尔排序，时间复杂度O(N^1.5)；空间复杂度O(1)；不稳定排序。
 *思路：先选定一个整数gap，把待排序文件中所有记录分成gap个组，所有距离为gap的记录分在同一组内，并对每一组内的元素进行排序。然后将gap逐渐减小重复上述分组和排序的工作。当到达gap=1时，所有元素在统一组内排好序。
*/
void ShellSort(int a[], int n){
    int gap = n;
    while (gap > 1)
    {
        //gap /= 2;
        gap = gap / 3 + 1;
        for (int i = 0; i < n - gap; i++)
        {
            int end = i;
            int x = a[end + gap];
            while (end >= 0)
            {
                if (a[end] > x)
                {
                    a[end + gap] = a[end];
                    end -= gap;
                }
                else
                {
                    break;
                }
            }
            a[end + gap] = x;
        }
    }
}

/*
 *选择排序，时间复杂度O(N^2); 空间复杂度O(1);不稳定排序。
 *思路：第一次从待排序的数据元素中选出最小（或最大）的一个元素，存放在序列的起始(末尾)位置，然后选出次小(或次大)的一个元素，存放在最大(最小)元素的下一个位置，重复这样的步骤直到全部待排序的数据元素排完。优化：每次最大和最小同时选.
*/
void SelectSort(int a[], int n){
    //保存数组的起始位置
    int begin = 0;
    //保存换数组的末尾位置
    int end = n - 1;
    int temp;
    while (begin < end)
	{
            int maxi = begin;//保存最大元素下标
            int mini = begin;//保存最小元素下标
            //遍历数组寻找最小和最大元素
            for (int i = begin; i <= end; i++)
            {
                if (a[i] < a[mini])
                {
                    mini = i;
                }
                if (a[i] > a[maxi])
                {
                    maxi = i;
                }
            }
            //将最小元素交换到起始位置
            temp = a[begin];
            a[begin] = a[mini];
            a[mini] = temp;

            //判断最大值的位置是否在起始位置
            if (maxi == begin)
            {
                    maxi = mini;    
            }
            //将最大元素交换到末尾位置
            temp = a[end];
            a[end] = a[maxi];
            a[maxi] = temp;
            //移动数组起始和末尾位置
            begin++;
            end--;
        }
}

/*
 *堆排序，时间复杂度O(N*logN)；空间复杂度O(1)；不稳定排序。
 *思路：升序为例，构建一个堆结构，然后每个父节点均替换为子节点的最大值，然后根节点就是最大值，重复这个步骤。
*/
void HeapAdjust(int H[], int s, int length)
{
    int tmp = H[s];
    // 左孩子结点的位置。(i+1 为当前调整结点的右孩子结点的位置)
    int child = 2 * s + 1; 
    while (child < length)
    {
        if (child + 1 < length && H[child] < H[child + 1])
        { // 如果右孩子大于左孩子(找到比当前待调整结点大的孩子结点)
            child++;
        }
        if (H[s] < H[child])
        {   // 如果较大的子结点大于父结点
            H[s] = H[child]; // 那么把较大的子结点往上移动，替换它的父结点
            s = child;       // 重新设置s ,即待调整的下一个结点的位置
            child = 2 * s + 1;
        }
        else
        { // 如果当前待调整结点大于它的左右孩子，则不需要调整，直接退出
            break;
        }
        H[s] = tmp; // 当前待调整的结点放到比其大的孩子结点位置上
    }
}
/**
 * 初始堆进行调整
 * 将H[0..length-1]建成堆
 * 调整完之后第一个元素是序列的最小的元素
 */
void BuildingHeap(int H[], int length)
{
    // 最后一个有孩子的节点的位置 i=  (length -1) / 2
    for (int i = (length - 1) / 2; i >= 0; --i)
        HeapAdjust(H, i, length);
}
void HeapSort(int H[], int length)
{
    // 初始堆
    BuildingHeap(H, length);
    // 从最后一个元素开始对序列进行调整
    for (int i = length - 1; i > 0; --i)
    {
        // 交换堆顶元素H[0]和堆中最后一个元素
        int temp = H[i];
        H[i] = H[0];
        H[0] = temp;
        // 每次交换堆顶元素和堆中最后一个元素之后，都要对堆进行调整
        HeapAdjust(H, 0, i);
    }
}

/*
 *快速排序，时间复杂度O(N*logN)；空间复杂度O(logN)；不稳定排序。
 *思路：最右边的值为基准值，按照该排序码将待排序集合分割成两子序列，左子序列中所有元素均小于基准值，右子序列中所有元素均大于基准值，然后最左右子序列重复该过程，直到所有元素都排列在相应位置上为止。确定两个指针left 和right 分别从左边和右边向中间遍历数组。如果选最右边为基准值，那么left指针先走，如果遇到大于基准值的数就停下来。然后右边的指针再走，遇到小于基准值的数就停下来。交换left和right指针对应位置的值。重复以上步骤，直到left = right ，最后将基准值与left(right)位置的值交换。
*/
int PartSort(int a[], int left, int right){
    // 选最右面为基准
    int key = right;
    while(left < right){
	//选右边为基准值，左指针先走
        while(left < right && a[left] <= a[key]){
            left++;
        }
        //右指针再走
        while(left < right && a[right] >= a[key]){
            right--;
        }
        // 交换
        int temp = a[right];
        a[right] = a[left];
        a[left] = temp;
    }
    int temp = a[key];
    a[key] = a[left];
    a[left] = temp;
    return left;
}
void QuickSort(int a[], int left, int right){
    if(left >= right)return;
    // 第一次快排
    int keyi = PartSort(a, left, right);
    // 左子序列快排
    QuickSort(a, left, keyi - 1);
    // 右子序列快排
    QuickSort(a, keyi + 1, right);
}

/*
 *归并排序，递归实现，时间复杂度O(N*logN)；空间复杂度O(N)；稳定排序。
  *思路：采用分治法，将已有序的子序列合并，得到完全有序的序列；即先使每个子序列有序，再使子序列段间有序。
*/
void _MergeSort(int* a, int left, int right,int* tmp)
{
    //区间中没有元素时不再合并
    if (left >= right)
    {
        return;
    }
    //划分数组，每次一分为二
    int mid = (left + right) / 2;
    _MergeSort(a, left, mid,tmp);//划分左区间
    _MergeSort(a, mid + 1, right,tmp);//划分右区间
 
    //合并有序序列
    int begin1 = left, end1 = mid;//有序序列1
    int begin2 = mid + 1, end2 = right;//有序序列2
    int i = left;
    //注意结束条件为一个序列为空时就停止
    while (begin1 <= end1 && begin2 <= end2)
    {
        if (a[begin1] < a[begin2])
        {
            tmp[i++] = a[begin1++];
        }
        else
        {
            tmp[i++] = a[begin2++];
        }
    }

    //两序列不可能同时为空，将剩余元素合并
    while (begin1 <= end1)
    {
        tmp[i++] = a[begin1++];
    }

    while (begin2 <= end2)
    {
        tmp[i++] = a[begin2++];
    }
 
    //将合并后的序列拷贝到原数组中
    //在这里拷贝的原因是 保证返回到上一层递归后两个子序列中的元素是有序的
    int j = 0;
    for (j = left; j <= right; j++)
    {
        a[j] = tmp[j];
    }
}
void MergeSort(int* a, int n)
{
    //因为需要将两个有序序列合并，需借助额外数组
    int* tmp = (int*)malloc(sizeof(int) * n);
    if (tmp == NULL)
    {
        perror("malloc");
        exit(-1);
    }
    _MergeSort(a, 0, n - 1,tmp);
    free(tmp);
    tmp = NULL;
}

int main(){
    // MaoPao(a);
    // ChaRu(a);
    // ShellSort(a, len);
    // SelectSort(a, len);
    // HeapSort(a, len);
    // QuickSort(a, 0, len - 1);
    // MergeSort(a, len);
    cout<<"out:"<<endl;
    for(int i = 0; i < len; i++){
        cout<<a[i];
        cout<<',';
    }
}

C++容器常见使用

vector

c++
vector<int> v;//默认初始化
vector<int> v(v1);//用v1初始化v
vector<int>v(v1.begin(),v1.end());//用v1初始化v
vector<int> v(10);//定义一个大小为10的数组！
vector<int> v(10,1)//定义个全为1而且长度为10的数组

a.front() //返回第一个元素
a.back() //末尾元素
c.begin() 返回一个迭代器，它指向容器的第一个元素
c.end() 返回一个迭代器，它指向容器的最后一个元素的下一个位置
c.rbegin() //返回一个逆序迭代器，它指向容器的最后一个元素
c.rend() 返回一个逆序迭代器，它指向容器的第一个元素前面的位置
v,push_back() //增
v.insert() //插入
    1、v.insert(p, t) //将t插到p的前面
    2、v.insert(p, n, t) //将n个t插入p之前
    3、v.insert(p, i, j) //将区间[i,j)的元素插入到p之前
v.pop_back();//删除最后一个元素
v.erase(t,k)
    1、v.erase(t,k)//删除[t,k)之间的元素
    2、v.erase(p)//删除p指向的元素
v.chear()==v.erase(begin(),end());//删除所有元素

//下标法
int length = v.size();
for(int i=0;i<length;i++)
    {
        cout<<v[i];
    }
cout<<endl;
//迭代器法
vector<int>::const_iterator iterator = v.begin();
for(;iterator != v.end();iterator++)
    {
        cout<<*iterator;
    }

set容器

set底层实现通常是平衡二叉树元素自动排序，这为查找元素提供了良好性能，但同时也造成了一个重要限制：不能直接改变元素值，因为这会打乱原本正确的顺序。

unordered_set底层实现通常是hash-table元素是无序的。

c++
#include <set>

/*set 生成*/
set<int> st;

/*set 迭代器*/
set<int>::iterator iter 
st.begin() 
st.end() 

/*set 插入*/
st.insert(2); //插入一个元素

/*set 删除*/
st.erase(st.begin()); //删除迭代器指向元素 
st.erase(2); //删除所有为2的元素 

/*set 容量*/
st.size()

/*set 查找*/
st.find(2) //从前往后找，若找到，返回指向该处的迭代器；反之，返回迭代器st.end()
st.lower_bound(x) //二分查找大于等于x的元素中最小的一个，并返回指向该元素的迭代器。
st.upper_bound(x) //二分查找大于x的元素中最小的一个，并返回指向该元素的迭代器。

/*set 某元素个数*/
st.count(2); //返回容器里2的个数

/*set 判空*/
st.empty() //返回布尔值 

/*set 清空*/
st.clear();

map容器

c++
#include <map>

/*map 生成*/
map<key_type, value_type> name;
map<int, int> mp;

/*map 迭代器*/
map<int, int>::iterator iter
mp.begin() 
mp.end() 

/*map 键值*/
iter->first //key
iter->second //value

/*map 插入*/
mp[2] = 5; //直接添加
mp.insert(pair<int, int>(2, 5)); //insert一个pair

/*删除*/
mp.erase(iter); //删除迭代器所指的键值对 

/*map 容量*/
mp.size()

/*map 查找*/
mp.find(2) //从前往后找，若找到，返回指向该处的迭代器；反之，返回迭代器mp.end()

/*map 某元素个数*/
st.count(2); //返回key为2的个数（map中只可能是0或者1） 

/*map 判空*/
mp.empty() //返回布尔值 

/*map 清空*/
mp.clear();

stack 容器

c++
#include <stack>

/*stack 生成*/
stack<int> sk;

/*stack 插入*/
sk.push(2); //把一个元素放入栈 

/*stack 删除*/
sk.pop(); //删除栈顶的元素 

/*stack 栈顶*/
sk.top(); //返回栈顶元素 

/*stack 容量*/
sk.size();

/*stack 判空*/
sk.empty()

queue容器

c++
#include <queue>

/*queue 生成*/
queue<int> q;

/*queue 头尾*/
q.front();
q.back();

/*queue 插入*/
q.push(2); //在队尾插入一个元素 

/*queue 删除*/
q.pop(); //在队首删除一个元素

/*queue 容量*/
q.size();

/*queue 判空*/
q.empty()

priority_queue 容器

c++
/*
头文件queue主要包括循环队列queue和优先队列priority_queue两个容器。其中priority_queue容器相当于大根堆（或者小根堆），大根堆每次堆顶是最大元素，小根堆每次堆顶是最小元素。（以下typename均用int举例）
*/
#include <queue>

/*priority_queue 生成*/
priority_queue<int> q; //大根堆
priority_queue<int, vector<int>, greater<int>> q; //小根堆

/*priority_queue 插入*/
q.push(2); //把一个元素插入堆 

/*priority_queue 删除*/
q.pop(); //删除堆顶的元素 

/*priority_queue 堆顶*/
q.top(); //返回堆顶元素 

/*priority_queue 容量*/
q.size();

/*priority_queue 判空*/
q.empty()

list双向链表

deque

deque是double ended queue的缩写，是一个动态数组，可以向两端发展(双向开口的连续线性空间)，因此无论在头部或者尾部安插元素都十分迅速，在中间按插元素则比较费时，因为必须移动其他元素。双端队列的元素被表示为一个分段数组，容器中的元素分段存放在一个个大小固定的数组中，此外，容器还需要维护一个存放这些数组首地址的索引数组。

初始化与定义已经在序列要求里面，而且方法与vector类似，只是多了push_front()(),pop_front(),这里不做过多的阐述。

c++
#include <deque>

/*dequeue 生成*/
dequeue<int> dq;

/*dequeue 头尾*/
dq.front();
dq.back();

/*dequeue 迭代器*/
dq.begin() 
dq.end()

/*dequeue 插入*/
dq.push_front(2); //头插入 
dq.push_back(2); //尾插入 

/*dequeue 删除*/
dq.pop_front(); //头删除 
dq.pop_back(); //尾删除 

/*dequeue 容量*/
dq.size();

/*dequeue 判空*/
dq.empty()

/*dequeue 清空*/
dq.clear();

pair容器

c++
#include <utility>

/*pair 生成*/
pair<int, int> pr = make_pair(0,1);
pair<int, int> pr(0, 1);

/*pair 两个值*/
pr.first 
pr.second 

/*pair 多与其他容器结合使用*/
set<pair<int, int>> st;
vector<pair<int, int>> vct(mp.begin(), mp.end());

2024-04-20

1.使用MQTT实现智能家居-基于所有Linux开发板

1.相关概念

MQTT协议全称是Message Queuing Telemetry Transport，翻译过来就是消息队列遥测传输协议，它是物联网常用的应用层协议，运行在TCP/IP中的应用层中，依赖TCP协议，因此它具有非常高的可靠性，同时它是基于TCP协议的 <客户端-服务器> 模型发布/订阅主题消息的轻量级协议，也是我们常说的发送与接收数据。

MQTT适合物联网,类似：订阅电视台某个频道。

MQTT报文格式：

固定报头：占两个字节，第一个字节的高4位表示控制报文的类型(两个保留使用14个)，低4位表示报文类型的标志位，PUBLISH报文的第一字节bit3是控制报文的重复分发标志（DUP），bit1-bit2是服务质量等级，bit0是PUBLISH报文的保留标志，用于标识PUBLISH是否保留，当客户端发送一个PUBLISH消息到服务器，如果保留标识位置1，那么服务器应该保留这条消息，当一个新的订阅者订阅这个主题的时候，最后保留的主题消息应被发送到新订阅的用户。固定报头的第二个字节开始是剩余长度字段，是用于记录剩余报文长度的，表示当前的消息剩余的字节数。
可变报头：只有某些报文才拥有可变报头，可变报头的内容会根据报文类型的不同而有所不同。CONNECT报文的可变报头包含四个字段：协议名（Protocol Name）、协议级别（Protocol Level）、连接标志（Connect Flags）(一些标志位，如遗嘱的状态和是否有用户名密码等)以及保持连接（Keep Alive）字段。
有效荷载：有效载荷也是存在与某些报文中，不同的报文有效载荷也是不一样的，比如：CONNECT报文的有效载荷（payload）包含一个或多个以长度为前缀的字段，可变报头中的标志决定是否包含这些字段。如果包含的话，必须按这个顺序出现：客户端标识符，遗嘱主题，遗嘱消息，用户名，密码。SUBSCRIBE报文的有效载荷包含了一个主题过滤器列表，它们标识着客户端想要订阅的主题，每一个过滤器后面跟着一个字节，这个字节被叫做服务质量要求（Requested QoS），它给出了服务端向客户端发送应用消息所允许的最大QoS等级。

2.开源mqttclient框架分析

程序设计(分层)：

app：根据数据控制设备，while(1){等待消息；处理消息；}
协议层：负责数据的解析、打包，MQTT/FTP/SSH；
平台/驱动：负责设备初始化、数据收发，提供定时器/多线程/网卡收发；

客户端程序框架：

订阅端要做的事情：连接、订阅(主题)、等待；
发布端要做的事情：连接、发布(主题+消息本身)；

1.连接服务器函数调用过程

2.创建线程调用过程其中创建的线程中的函数mqtt_yield_thread会读网络数据，处理数据包，保持心跳

3.发布消息调用过程

4.订阅消息过程

消息何时到来？不知道！

所以，必定是某个内核线程不断查询网卡：

读网卡数据
- 得到数据的话就判断、处理

在第2步创建的线程，while(1){读网络数据；if(是否是一个发布者消息){判断那个topic,并执行对应的函数；}}

3.在Ubuntu上使用MQTT

git clone官方代码(用韦东山的，现在更新的有点问题)；
安装cmake：sudo apt-get install cmake g++
编译 & 运行：./build.sh
运行build.sh脚本后会在 ./build/bin/目录下生成可执行文件emqx、baidu、onenet等多个平台的可执行程序，直接运行即可：./build/bin/emqx

4.在Linux开发板上使用MQTT

源码直接复现：

官方代码编译不出来，用韦东山保存的mqttclient代码，进行交叉编译(注意修改代码后要先移除原先编译的build，不然不回更新可执行文件。
实际操作：

shell
// 1. 创建文件
$ cat arm-linux.cmake
set(CMAKE_SYSTEM_NAME Linux)
set(CMAKE_C_COMPILER arm-buildroot-linux-gnueabihf-gcc)
set(CMAKE_CXX_COMPILER arm-buildroot-linux-gnueabihf-g++)
// 2. 修改build.sh
cmake .. "-DCMAKE_TOOLCHAIN_FILE=../arm-linux.cmake"
// 3. 执行
./build.sh
// 4. 编译库，得到：./libmqttclient/lib/libmqttclient.so
./make-libmqttclient.sh
// 5. 修改代码后要先移除build文件夹
rm -rf build

在工程中使用MQTT方法：

方法1：修改MQTT源码，然后执行rm -rf build和./build.sh
方法2：使用库
1. 编译库(./make-libmqttclient.sh)，得到：./libmqttclient/lib/libmqttclient.so
2. 将编译得到的./libmqttclient/include和libmqttclient.so复制出来再在makefile里编译时加上头文件.h的路径、库的路径、其他库的路径。
3. 将库文件libmqttclient.so拷贝到开发板的/lib目录，开发板就能找到这个库了。
方法3：把MQTT源码放入自己的工程
1. 使用makefile来管理，可以使用韦东山提供的makefile模板；
2. 添加头文件，库的位置等等；

2.物联网视频监控系统

1.两种方案：

MJPG-streamer：可以运行在低性能的板子上，对ARM板的性能要求不高，主频200MHz的ARM芯片也能实现。
ffmpeg：比较热门的流媒体方案；

2.相关概念

流媒体协议：RTMP、HTTP-FLV、HLS
推流端：ffmpeg；
流媒体服务器：Nginx；
拉流端：浏览器/VLC播放器；

3.MJPG-streamer程序框架：

在imx6ull上运行mjpg推流到本地ip的8080端口：


mjpg_streamer -i "/usr/lib/mjpg-streamer/input_uvc.so -d /dev/video1 -f 30 -q 90 -n" -o "/usr/lib/mjpg-streamer/output_http.so -w /usr/share/mjpg-streamer/www"

4.FFmpeg数据传输流程：

音视频编解码流程：

5.摄像头和声卡接口

1.摄像头接口(v4l2)：

设置格式：分辨率、图像的格式、帧率；
启动摄像头；
得到数据：app向内核请求buffer,将buffer放入队列，摄像头驱动程序将数据存入buffer,app将buffer出列，得到数据。
停止；

2.声卡接口(ALSA)：

指标：采样频率、采样精度(多少位编码)；
比较复杂需要使用ioctl设置很多参数，所以一般基于alsa-lib来编写app;

6.流媒体服务器nginx反向代理

移植nginx方法：1.下载源码，手工编译。2.使用Buildroot,配置选择nginx，直接编译生成映像文件。

使用Buildroot：

设置交叉编译工具链
下载第3方模块：
1. 在Buildroot目录下，创建目录：mkdir dl/nginx
2. 使用git下载：cd dl/nginx && git clone https://github.com/winshining/nginx-http-flv-module.git
3. 在2020年使用GIT下载这个模块时，实验成功。在2023年时失败，可能是这个模块引入了bug。我们执行上述命令得到的是最新的源码，还要执行以下命令取出2020年的源码： cd dl/nginx/nginx-http-flv-module ; git checkout 1ccfee122804b28c60f1f923eee7824a5111680c
在Buildroot根目录
1. make menuconfig
2. 把原来的lighttpd去掉，否则板子也会自动启动它，就会有两个HTTP服务了：lighttpd, nginx
3. 如图选择Nginx，建议把所有功能都选上
4. 并且设置额外的参数，在“additional modules”中添加： $(TOPDIR)/dl/nginx/nginx-http-flv-module
5. 最后执行(先删除之前编译的nginx，我发现有时设置的第3方模块不起作用，删除后再make就可以了)：rm -rf output/build/nginx-1.15.7 && make
6. 这会在Buildroot的dl/nginx目录下自动下载源码，并编译
7. 结果保存在output/images目录下，有emmc.img, sdcard.img，可以直接烧写到板能的EMMC或SD卡上

rtmp协议走的端口经常被防火墙拦截，可以使用http_flv协议(修改配置文件增加一个location节点) rtmp推流给nginx过程：rtmp推流到某个地址，nginx访问的html界面中含有这个地址，就能观看到摄像头视频；

7.内网穿透：

可以使用花生壳实现内网穿透只要本地浏览器可以拉流，就可以映射到花生壳，但是免费版带宽只有1Mbps很卡；
也可以将nginx部署到自己的服务器；

3.基于Linux从零写BootLoader

单板下载方式：

后台式下载：在升级的时候，新固件在后台悄悄下载，即新固件下载属于应用程序功能的一部分，在新固件下载过程中，应用可以正常使用。下载完成后，系统再跳到BootLoader程序，由BootLoader完成新固件覆盖老固件的操作
非后台式下载：在升级的时候，系统需要先从应用程序跳入到BootLoader程序，由BootLoader进行新固件下载工作，下载完成后BootLoader继续完成新固件覆盖老固件的操作，至此升级结束。

新旧固件覆盖模式：

双区模式：双区模式中老固件和新固件在flash中各占一块bank（存储区），对应后台式下载；
单区模式：单区模式的非后台式下载只有一个bank0（运行区），老固件和新固件共享这一个bank0，对应非后台式下载。

MCU OTA升级过程：

制作升级包：固件Firmware通过数字签名得到升级包(包括firmware、header和signature value);
下载升级包：根据上位机软件和MCU设备约定的通信协议，上位机软件将升级包通过OTA方式发送给MCU设备，MCU设备收到数据后，根据通信协议解析出升级包的数据，并将升级包的数据保存到存储器中。
验签升级包：MCU设备接收完所有的升级包后，先计算升级包中固件的摘要，然后使用非对称秘钥的公钥解密升级包的签名值，如果解密出来的固件摘要与自己计算的摘要相同，则验签成功。
固件更新：验签成功保证了固件的完整性和合法性后，MCU设备从应用程序进入BootLoader程序，在BootLoader程序中将flash中的新固件数据搬运到旧固件的存储区，将其覆盖。然后BootLoader程序启动固件运行，此时固件为新固件。

Linux OTA升级过程：升级过程基本和MCU类似，有以下概念：

linux系统主要由三大部分组成为uboot(引导启动程序)、kernel(内核)和rootfs(根文件系统)，在flash中以此存放。
Linux系统的启动流程：上电->bootloader->(启动)->kernel->(挂载)->rootfs->(启动)->app;
一般可在uboot中下载升级包来升级uboot\kernel\rootfs ，与MCU在BootLoader程序中完成升级类似。
应用程序升级流程：制作升级包（打包签名工具）、下载升级包（下载工具）、升级包验签、程序更新。（与MCU OTA升级的区别：在制作升级包时将应用程序相关的文件，比如可执行程序、库文件、配置文件打包为压缩包再进行签名）
OTA升级的核心：1.如何接收固件；2.如何保证固件的完整性和合法性；3.如何替换固件；

RAM、ROM、Flash的区别：

RAM：掉电数据丢失，但运行快，正是因为运行快，所以程序中变化的数据都会在RAM中变化，变量也存储在里面。
flash：运行慢，但掉电数据不丢失，正是因为掉电不丢失，所以写好的程序会存在flash里面。
ROM：一种半导体内存，其特性是一旦储存资料就无法再将之改变或删除。通常用在不需经常变更资料的电子或电脑系统中，资料并且不会因为电源关闭而消失。只能读出事先所存数据的固态半导体存储器。
在单片机中RAM是存变量以及变量的运算的地方，flash是存程序的地方。

BootLoader 引入的目的：更新系统；主要作用：

初始化硬件：比如设置时钟、初始化内存；
启动内核/APP：从Flash读出内存、存入内存、给内核设置参数、启动内核；
调试作用：在开发产品时，需要经常调试内核，使用BootLoader可以方便地更新内核；

必备知识：段/重定位散列文件异常向量

4.uboot移植

uboot：universal bootloader; uboot就是一个裸机程序，功能是用来启动内核，进而启动各种应用程序；作为通用的bootloader能支持很多soc厂家、板卡厂家、开发的不同型号的板；

linux硬件组成：

在flash中有uboot、内核和文件系统的程序。单片机内存比较小一般64KB，可以直接用SRAM(不用初始化)，linux内存比较大，几百M，几G，一般用DDR/SDRAM(需要初始化)

uboot有flash的驱动程序，能读flash，上电启动过程：

先运行uboot，启动内核：
1. 初始化内存；
2. 初始化其他硬件(时钟、flash);
3. 读flash把内核copy进内存；
4. 启动内核；
内核程序启动应用程序：
1. 读写flash，启动驱动程序：网络/u盘/LCD/其他输入输出设备；
2. 以一定的格式能读写文件，文件系统；
3. 找到并启动APP；

uboot源码提供了dtb目录用来各种厂家的设备树指定硬件资源，这些dts文件不会编译进uboot的可执行文件，只作为配置文件传给uboot使用。

烧录的uboot = 原始uboot.bin + 某个dtb；

保证uboot源码不臃肿。

XIP(execute in place)，RAM和Flash都是XIP设备，cpu可以直接发出地址信号读得到指令并执行，都是cpu读取指令就好像直接在内存上运行的程序，其实执行是在cpu上。SD卡就不是XIP设备，需要CPU通过emmc控制器读取SD上的指令然后运行(这个过程需要通过BootROM，cpu可以直接读BootROM上代码执行，BootROM上的代码可以将SD卡上的uboot上的程序读到内存中)。

因此uboot启动流程，根据uboot代码位置分为两种情况：

对于XIP设备：
1. 硬件初始化(内存、flash、时钟等)；
2. 读flash，把内核copy进内存;
3. 启动内核；
对于非XIP设备：
1. 由BootROM把uboot复制进内存RAM；
2. 下面开始执行uboot；
3. 硬件初始化(不用初始化RAM)；
4. 读flash，把内核copy进内存;
5. 启动内核；

uboot源码结构，在u-boot目录下执行"tree . -d > 1.txt"，可以得到目录的结构，精简如下：

shell
├── arch    
│   ├── arm              // 1. 架构相关
│   │   ├── cpu
│   │   │   ├── armv7
│   │   │   │   ├── mx6
│   │   ├── dts
│   │   │   └── include
│   │   │       └── dt-bindings -> ../../../../include/dt-bindings
│   │   ├── include
│   │   │   ├── asm
│   │   │   │   ├── arch-imx
│   │   │   │   ├── arch-imx8
│   │   │   │   ├── arch-imx8m
│   │   │   │   ├── imx-common
│   │   │   └── debug
│   │   ├── lib
│   │   ├── mach-rockchip
│   │   │   ├── rk3036
│   │   │   ├── rk3288
│   │   │   └── rk3399
│   │   ├── lib
├── board                // 单板相关
│   ├── freescale
│   │   ├── common
│   │   │   └── p_corenet
│   │   ├── corenet_ds
│   │   ├── mx6ul_14x14_ddr3_arm2
│   │   ├── mx6ul_14x14_evk
│   │   ├── mx6ul_14x14_lpddr2_arm2
│   │   ├── mx6ull_ddr3_arm2
│   │   ├── mx6ullevk
├── cmd                  // 通用的命令
│   ├── fastboot
│   └── mvebu
├── common               // 通用的
│   ├── eeprom
│   ├── init
│   └── spl
├── configs
├── disk
├── drivers               // 各类驱动
├── fs                    // 文件系统
│   ├── cbfs
│   ├── cramfs
│   ├── ext4
│   ├── fat
│   ├── jffs2
│   ├── reiserfs
│   ├── sandbox
│   ├── ubifs
│   ├── yaffs2
│   └── zfs
├── include
├── lib                  // 库
├── net                  // 网络协议

Makefile分析：比如all规则，clean规则，include语法；

vim命令删除注释:g/^#/d

uboot中有很多源码，用编译哪些源码得到最后的uboot.bin文件需要配置。比如IMX6ULL配置命令: make mx6ull_14x14_evk_defconfig生成了.config文件。

执行过程：

制作工具：scripts/kconfig/conf
把默认配置信息写入文件".config"

文件.config中含有架构、soc、厂家、单板等配置信息。

以命令mx6ull_14x14_evk_defconfig为例分析怎么得到的.config文件：

从makefile中分析过程，mx6ull_14x14_evk_defconfig依赖scripts/kconfig/conf，又依赖其他东西...，makefile中以下过程展开：

shell
mx6ull_14x14_evk_defconfig: scripts/kconfig/conf
	$(Q)$< $(silent) --defconfig=arch/$(SRCARCH)/configs/$@ $(Kconfig)

就是：

shell
UBOOTVERSION=2017.03 scripts/kconfig/conf --defconfig=arch/../configs/mx6ull_14x14_evk_defconfig Kconfig

所以要分析scripts/kconfig/conf.c，该代码整体结构：

shell
defconfig_file = "arch/../configs/mx6ull_14x14_evk_defconfig";
name = "Kconfig"

conf_parse(name);  // 解析uboot根目录下的Kconfig文件

conf_read(defconfig_file); // 读配置文件

conf_set_all_new_symbols(def_default); // 设置new_symbols为默认值

conf_write(NULL); // 写到.config

分析结果：

Kconfig：这是一个通用文件，里面规定了一些依赖，比如：
- 如果是ARM架构，就默认选中A、B、C配置
- 如果是RISC-V架构，就默认选中a、b、c配置
defconfig_file：这是厂家提供的，里面定义了
- ARM架构
- 自己的一些配置项
怎么处理呢？
- 使用defconfig_file的内容去解析Kconfig，确定各个依赖的配置项
- 其他未涉及的配置项，给它们指定默认值
- 写入.config

uboot config界面语法(增加配置项、菜单(多选、单选)，选择了某个配置项后就会把这个功能编进uboot里)；

得到的.config用来选择哪些目录/文件被编译，并得到一个.h文件存放.c文件用到的宏等；

得到.config后，使用make就可以编译uboot了，内部过程：

检查更新头文件，比如include/config.h、u-boot.cfg(才是完全的最终的信息)
制作工具
交叉编译：编译哪些目录哪些文件，.c文件可能需要使用.config的配置值，它可以引用config.h

整体理解uboot编译流程（涉及子文件目录的编译等等，Makefile文件还是很复杂的）

XIP

BootROM

相对寻址、绝对寻址

uboot完整启动流程总结：

2024-04-16

基本概念

机器学习

1.常见的激活函数

Sigmoid：1/（1+e-x）缺点：梯度消失;
Tanh：=2Sigmoid(2x) - 1缺点：梯度消失;
Relu：=x(x>0时) =0(x<0时);

2.卷积运算的输出尺寸：

Out = (in + 2p - k)/s + 1;

3.NoSql

非关系型数据库，不使用SQL作为主要查询语言，而是主要以key-value键值对的形式进行数据存储。这种数据库设计主要针对当前互联网时代的复杂数据，具备高度的可伸缩性和可用性。作用：作为缓存减少IO读操作，减轻CPU和IO压力，通过内存直接读取数据，相对于传统关系型数据库，能够处理超大规模和高并发数据。

4.分布式计算

如何应用分布式系统进行计算，即把一组计算机通过网络相互连接组成分散系统，然后将需要处理的数据分散成多个部分，交由分散在系统内的计算机组同时计算再将结果最终合并得到最终结果。

5.大数据相关的技术(工具、技术和方法)：

大数据存储技术：包括分布式文件系统（如HDFS）、分布式数据库（如Cassandra、HBase）和NoSQL数据库（如MongoDB、Redis）等。
大数据处理技术：包括分布式计算框架（如MapReduce、Spark）、流处理框架（如Storm、Flink）和图处理框架（如Giraph）等。
大数据分析技术：包括数据挖掘、机器学习、统计分析等方法，以及可视化工具（如Tableau、PowerBI）等。
大数据采集技术：包括数据抓取技术、数据清洗技术、数据集成技术等。大数据安全技术：包括数据加密、数据备份、数据恢复等，保证数据的安全性和可靠性。

6.LR（Logistic Regression）(一种解决二分类的机器学习方法)

LR是一种用于二分类和多分类问题的线性模型。它使用逻辑函数将输入特征与输出概率之间建立关联，通常用于概率建模和分类任务。

7.准确率有什么缺点和问题

准确率（Accuracy）在不平衡数据集中容易误导，因为它不考虑类别之间的不平衡。在类别分布不均匀时，准确率可能不是一个合适的评估指标，需要考虑其他指标如精确度、召回率、F1分数等。

8.常见的优化算法

常见的优化算法包括梯度下降法（包括随机梯度下降和批量梯度下降）、Adam、RMSprop、Adagrad等。这些算法用于调整模型参数以最小化损失函数。

9.常见的特征提取方法

常见的特征提取方法包括主成分分析（PCA）、线性判别分析（LDA）、单词嵌入（Word Embeddings）、卷积神经网络（CNN）特征提取等，用于从原始数据中提取有用的特征。

10.CNN和MLP区别，CNN的优势

CNN（卷积神经网络）和MLP（多层感知机）都是神经网络模型，但CNN在处理图像和空间数据时具有优势。CNN使用卷积层和池化层可以捕捉局部特征和空间结构，减少了参数数量，并且在图像处理等领域表现出色。

11.RNN和LSTM，优缺点

RNN（循环神经网络）是一种适用于序列数据的神经网络，但它存在梯度消失和梯度爆炸的问题。LSTM（长短时记忆网络）是RNN的一种变体，通过门控机制解决了梯度问题，可以更好地捕捉长期依赖性。然而，LSTM相对复杂，训练和计算成本较高。

12.常见的传统机器学习算法

线性回归、逻辑回归、决策树、支持向量机、朴素贝叶斯等

13.过拟合(overfitting)与解决办法

过拟合是训练效果很好，预测效果很差；解决：

增加数据量，数据增强；
正规化：（简化机器学习的关键公式为 y=Wx . W为机器需要学习到的各种参数. 在过拟合中, W 的值往往变化得特别大或特别小. 为了不让W变化太大, 我们在计算误差上做些手脚. 原始的 cost 误差是这样计算, cost = 预测值-真实值的平方. 如果 W 变得太大, 我们就让 cost 也跟着变大, 变成一种惩罚机制）
Dropout:训练的时候, 我们随机忽略掉一些神经元和神经联结 , 是这个神经网络变得”不完整”. 用一个不完整的神经网络训练一次.
简化模型:
多种模型组合：
贝叶斯方法：

14. min(x,y)的期望；X,Y服从0-1的高斯分布，问min(x,y)的期望

高斯分布

均匀分布：

阅读全文