廾匸 - 山与山不见面再见容易再见难

发表于2024-10-09

Stable diffusion服务器安装https://help.aliyun.com/zh/pai/use-cases/quick-start-stable-diffusion-webui?spm=a2c4g.11186623.0.0.64116ab4AEYoLb 1. 本地webui的安装设备：macbook air m2 系统：ios15 安装homebrew 终端输入/bin/bash -c "$(curl -fsSL https://gitee.com/ineo6/homebrew-install/raw/master/install.sh)" 验证是否安装成功brew -v得到输出Homebrew 4.4.0最新版本才支持ios15 安装python3、 brew install cmake protobuf rust python@3.10 git wget 更改阿里云下载镜像源 pip config set global.index -url...

大模型学习之多模态

发表于2024-10-04

参考多模态简述1. 多模态学习的概念模态(Modality)：食物表达或感知的方式多模态(multimodal)：研究异构(heterogeneous)和相互链接数据(interconnected data)的科学多模态的行为和信号： 2.多模态学习六大挑战及经典工作挑战一：Representation Learning 表式学习学习不同模态之间交叉交互，包括融合，协调和分裂等子挑战。挑战二：Aligment 对齐连接，对齐表示，分割，将不同模态之间的信息进行关联对齐挑战三：Reasoning 推理结构中间概念，外部范式，知识建模，不仅要求理解单个模态的信息，还要要求理解不同模态之间的信息如何进行交互，影响最终推理决策挑战四：Generation 生成摘要，翻译和生成，创造性的理解和生成信息一致的信息挑战五：Transference 迁移在模态之间转换知识，通过用一个模态的知识来提高另一个模态的能力挑战六：Quantification 量化更好的理解异构性，交叉模态交互，以及多模态学习的过程

Docker的学习与使用

发表于2024-10-03

Docker的学习与使用参考资料 1. 基本概念1.1 镜像(Image)Docker 镜像是一个特殊的文件系统，除了提供容器运行时所需的程序、库、资源、配置等文件外，还包含了一些为运行时准备的一些配置参数（如匿名卷、环境变量、用户等）。镜像不包含任何动态数据，其内容在构建之后也不会被改变。分层存储镜像构建时，会一层层构建，前一层是后一层的基础。每一层构建完就不会再发生改变，后一层上的任何改变只发生在自己这一层。比如，删除前一层文件的操作，实际不是真的删除前一层的文件，而是仅在当前层标记为该文件已删除。在最终容器运行的时候，虽然不会看到这个文件，但是实际上该文件会一直跟随镜像。因此，在构建镜像的时候，需要额外小心，每一层尽量只包含该层需要添加的东西，任何额外的东西应该在该层构建结束前清理掉。 1.2 容器(Container)镜像（Image）和容器（Container）的关系，就像是面向对象程序设计中的类和实例一样，镜像是静态的定义，容器是镜像运行时的实体。容器可以被创建、启动、停止、删除、暂停等。 1.3...

Notion记账本

发表于2024-10-01

Notion记账本参考：https://www.youtube.com/watch?v=TO7HfjW3A-M 别人写的参考笔记比我写的详细且简洁，优先推荐看它的，但现在有个痛点就是只能语音输入，有空了想把它搞成那种自动识别屏幕上的支付金额那种。利用Notion+iPhone快捷指令，设置好一个免费的记账APP 关于NotionNotion是一个支持高度个性化的笔记APP，大家也可以在网上找到很多好看的模版，下面是我自己现在的”图书馆”的界面。优点是三端互通，你可以在任何设备上去下载使用它，当然也可以通过网页(Notin 打钱！) 这里不过多去进行赘述，笔记的主题也不在Notion，感兴趣的小伙伴可以自己去了解下。效果展示 1. Notion-建立数据表这个数据表也可以直接去copy博主的->https://topbook.notion.site/Notion-072b44a33c684fcea96e882a91abe11c 上图的箭头哪里就是复制按钮添加支出项目支出类别支出金额支出时间...

大模型学习之微调

发表于2024-10-01

为什么需要PEFT微调简单来讲就是全参微调代价太大 PEFT几种方式adapter原理：针对每个Transfomer层，增加两个Adapter结构(分别是注意力层和前馈层之后，但在norm之前)。训练时，固定原来预训练模型参数不变，只对新增的Adapter结构和Layer Norm层进行微调缺点：增加了模型层数，推理延迟 prefix tuning原理：在输入token之前构造一段virtual tokens作为prefix，训练时只更新prefix部分参数，其他参数不变在每一层前端都加入virtual tokens 为防止直接更新prefix参数导致训练不稳定和性能下降，在prefix层前面加了MLP结构，训练完成后，只保留Prefix都参数缺点：额外token占用，降低有效序列长度 prompt tuning原理：给每个任务定义各自的prompt，拼接到数据上作为输入，但旨在输入层加入prompt tokens，且不加入MLP(显式加入token) p-tuning动机： prompt...

数据库

发表于2024-09-29

如何选择合适的数据库？1结构化数据/非结构数据1.1 结构化数据(structured data)有固定格式或模式的数据，通常可以用表格的形式来表示，每一列对应一个字段，每一行代表一条记录。特点：固定格式｜易于处理｜标准化应用场景：关系数据库：MySQL，PostgreSQL Excel，CSV，json/xml 1.2 非结构化数据(unstructured...

Tokenizer

发表于2024-09-22

Tokenizer 作用：将文本序列转化为数字(token)序列，作为transformer的输入分词粒度：word；character；subword Word Tokenizer按照词进行分词，如：”I love you” -> [“I”, “love”, “you”]优点：简单，容易理解，便于理解模型输出结果缺点：每个word分配一个id，所需的vocabulary根据语料大小而不同，会将意思一致的词分成两个不同的id Character Tokenizer按照字符进行分词，如：”I love you” -> [“I”, “ “, “l”, “o”, “v”, “e”, “ “, “y”, “o”, “u”]优点：vocabulary相对小的多，适合中文缺点：对于英语来说，分词后的每个字符是毫无意义的，且输入的长度会变长 Subword Tokenizer按照词的子词进行分词，常用于英语，如‘today is...

C语言

发表于2024-09-10

C语言1 基础知识1.1 编程语言的分类解释型语言：由解释器逐行解释和执行的编程语言。源代码不需要预先编译成机器代码，而是直接由解释器处理。(Python，JavaScript，Ruby，PHP) 编译型语言：在运行之前需要将源代码编译成机器代码（二进制代码）的编程语言。编译器将整个源代码翻译为可执行文件或中间代码。(C，C++，Rust，Go) 汇编型语言：一类与计算机的机器指令集紧密相关的低级编程语言(仍具有一定程度的可读性)。汇编语言直接映射到计算机的机器指令，但使用助记符表示指令。(x86 汇编，ARM 汇编，MIPS 汇编) 1.2 C++与python的区别 **C++**：静态类型语言：变量的类型在编译时就已确定，类型检查是在编译阶段进行的。编译型语言：将源代码转换为中间代码或汇编代码的过程。。高性能：C++ 编译生成的机器代码通常执行速度较快，适合对性能有高要求的应用。内存管理：C++...

大模型学习之数据集

发表于2024-09-10

数据集预训练数据集和指令微调数据集的比较1. 预训练数据集目的：学习通用的语言模式和特征，建立一个强大的语言理解和生成能力的模型格式：文本连续性：预训练数据集通常是由大量的连续文本组成的。这些文本可以来自书籍、文章、对话等无明确标签：预训练数据集不需要显式的输入-输出对。例如，GPT类模型通常只需要大量的未标注文本来预测下一词或填补掩盖词 2. 指令微调数据集目的：使模型能够理解和执行特定的任务指令，如回答问题，生成特定格式的文本等格式：明确的输入-输出对：指令微调数据集通常包含明确的输入(指令)和期望的输出(响应)。这些数据旨在训练模型根据特定的任务或指令生成准确的输出指令和响应的对话结构：通常以对话形式，包括“指令”与回应 LLaMA-Factory支持 alpaca 格式和 sharegpt 格式的数据集指令微调数据集的制作

部署

发表于2024-09-10

部署边缘端部署MAIX-3参考文档 MAIX-3部署参考板子启动烧录系统镜像使用读卡器插入SD卡，然后使用Etcher软件进行烧录。(参考文档有详细步骤) 连接板子这里使用MobaXterm进行连接，可以通过串口直接连接，以及网口，wifi等方式常用的基础命令包括： jupyter notebook 启动网页端notebook ifconfig -a 查看当前网络配置 nmtui-connect 图形化联网模型部署要部署模型到AXera-Pi，需要将模型量化到 ·INT8·，减小模型大小的同时提高运行速度，一般采用 PTQ(训练后量化)的方式量化模型步骤：1. 准备好浮点模型。2. 用模型量化和格式转换工具转换成 AXera-Pi 支持的格式，这里工具使用爱芯官方提供的 pulsar 3. 在 AXera-Pi 上运行模型。安装docker第一次尝试是安装windows版本的docker 然后拉取转换工具’docker pull sipeed/pulsar:0.6.1.2’ 模型转换pytorch...