Reliable AI Lab sft监督微调rl 强化学习算法huggingface access tokenhf_DLgHrHXhahUlmudfLaipoJwjBjitzRJitQ 从理解DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning这篇论文的LLM+RL+GRPO技术原理开始,结合VeRL github工 2025-07-02 夏 #未了
hnu 计算机系统 ShellLab 0 准备工作shellLab有以下三个文件,查看readme 使用命令tar xvf shelab-handout.tar 解压缩文件; 使用命令 make 去编译和链接一些测试例程; 查看ReadMe,以下为中文翻译 123456789101112131415161718192021################ CS:APP Shell 实验 ############# 2025-07-02 春 #未了
hnuOS lab3 实验过程设备树是用于解决ARM等嵌入式系统由于设备种类纷繁复杂导致的与平台相关的大量内核代码被大量重复的问题。通过设备树来描述系统硬件及其属性,然后通过bootLoader将其传递给kernel,以便kernel可以有较大的灵活性。如下图所示设备树的例子。我们要自己编写程序解析dtb文件,需要使用libfdt库(设备树编译器DTC的配套库)提供API接口以及处理设备树的二进制结构首先在wsl中安装 2025-07-02 春 #未了
hnu操作系统-lab10 HNU OSlab9实验目的实现一个shell 实验过程新建 src/include/prt_shell.h 头文件定义了一个shell控制块的结构体,负责维护shell会话状态、命令系统、输入输出缓冲和工作环境等信息。 1234567891011121314151617181920212223242526#ifndef _HWLITEOS_SHELL_H // 防止头文件被 2025-06-06 夏 #未了
hnu操作系统-lab8 HNU OSLab 8实验目的理解和实现操作系统中的内存管理机制 理解分页原理:学习操作系统中如何使用分页技术来管理内存,包括虚拟地址到物理地址的转换过程。 页表的创建和管理:编写代码来创建和管理页表,这是实现分页内存管理的核心部分。 内存映射配置:通过定义内存映射区域(mmu_mmap_region_s结构体数组),设置不同 区域的内存属性,如缓存共享、设备属性等。)MMU 寄存器配置:学习并配 2025-06-05 夏 #未了
hnu操作系统-lab7 lab7 信号量与同步信号量结构初始化新建 lab7/src/include/prt_sem_external.h 头文件 宏定义 12345678910111213141516171819202122232425262728293031#ifndef PRT_SEM_EXTERNAL_H#define PRT_SEM_EXTERNAL_H#include &q 2025-05-19 夏 #未了
循环神经网络 基础sequence时序模型:当前数据和之前观测的数据相关 统计工具:在时间t,观察到的价格Xt 概率计算 序列模型 自回归模型 给定前面t-1个数据来预测第t个数据 马尔可夫模型 假设当前之和最近少数数据相关 使用xt−1,…,xt−τ 而不是xt−1,…,x1来估计xt 潜变量模型 使用潜变量概况历史信息 保留一些对过去观测的总结ht, 并且同时更新预测x^t和总结ht。 这就产生了 2025-05-17 夏 #未了
hnu操作系统-lab6 Lab 6 :任务调度任务调度是操作系统的核心功能之一。 UniProton实现的是一个==单进程支持多线程==的操作系统。在UniProton中,一个任务表示一个线程。UniProton中的任务为==抢占式调度机制==,而非时间片轮转调度方式。高优先级的任务可打断低优先级任务,低优先级任务必须在高优先级任务挂起或阻塞 2025-05-13 夏 #未了
李宏毅-人类语言处理 https://speech.ee.ntu.edu.tw/~hylee/ml/2022-spring.php RNN GNN 补充深度学习没有学到的地方 机器学习 sequence补充self-attention输入是一个sequence且长度会改变 句子的表示[ 词汇 词汇 词汇 ] 词汇用vector表示 word embedding 给每一个词汇一个向量,一个句子就是一排 2025-05-12 夏 #未了
hnu操作系统-lab5 实验目的ARM的中断系统中断是一种硬件机制。借助于中断,CPU可以不必再采用轮询这种低效的方式访问外部设备。将所有的外部设备与CPU直接相连是不现实的,外部设备的中断请求一般经由中断控制器,由中断控制器仲裁后再转发给CPU。如下图所示Arm的中断系统。 配置gicv2中断控制器技术参考手册 GICv2 最多支持8个核的中断管理。 GIC包括两大主要部分(由图中蓝色虚竖线分隔,Distribut 2025-05-06 春 #未了