1987WEB视界-分享互联网热门产品和行业

您现在的位置是:首页 > 人工智能AI > 正文

人工智能AI

AI大模型团队Colossal-AI破局创新,火热招募中!

1987web2023-08-17人工智能AI115

公司简介

潞晨科技致力于解放 AI 生产力,通过高效多维并行、异构内存管理、大规模优化库、自适应任务调度等自研技术,打造面向大模型时代的通用深度学习系统 Colossal-AI ,高效促进 AI 大模型落地应用,助力企业低成本实现 AI 智能化产业升级。

公司核心成员来自美国加州伯克利、斯坦福、清华、北大、新加坡国立、南洋理工大学等世界一流高校,在国际顶级学术刊物或会议共发表论文近百篇,曾在谷歌、微软、NVIDIA、IBM、英特尔等头部科技公司任职,在高性能计算,人工智能,分布式系统方面已有十余年的技术积累,对核心技术、行业理解、产品落地等方面有卓越优势。

近日,潞晨科技宣布完成数亿元的 A 轮融资,主要用于团队扩张和业务拓展。

更多详情可了解:https://mp.weixin.qq.com/s/9PTIDIu9mmPtfK6km9xZqA。

招聘类型:社招、校招、实习招;

岗位 Base:北京、上海、新加坡;

联系邮箱:hr@hpcaitech.com。

潞晨为员工创造舒适和灵感迸发的工作场所,提供一个高效和创造性的工作环境。

潞晨科技办公环境。

如果你对 AI 大模型的开发和应用充满热情,请阅读以下招聘要求和职责,并提交你的简历,加入他们,共同探索创新的 AI 解决方案,挑战技术的极限,解放 AI 生产力!

在招岗位

AI 大模型训练研发工程师

AI 大模型算法工程师

AI 大模型推理工程师

云计算研发工程师

岗位详情

AI 大模型训练研发工程师

岗位职责:

参与 ColossalAI 分布式深度学习系统的开发,负责设计、实现以及优化各类分布式训练技术;

参与 Colossal-AI 与各类社区项目(比如 PyTorch Lightning, Hugging Face)的集成;

维护开源社区,参与社区用户互动以及维护开源项目基础设施。

任职要求:

精通 PyTorch,了解 Tensorflow/Caffe 等任意一种深度学习框架,并掌握 DeepSpeed/NVIDIA Megatron/Ray 等分布式训练框架;

熟悉 BERT/GPT/Diffusion 等当前热门的 CV/NLP/Audio 模型,有百亿 / 千亿大模型分布式训练经验;

了解并行计算、CUDA、网络通信、系统优化、集群硬件架构等 HPC 相关的知识;

具备良好的编程能力,熟练掌握 Python,掌握 C++、数据结构和算法设计,熟悉 Linux / Unix 系统和 Shell 编程,熟练使用 Git;

至少一年以上的 AI 分布式系统研发相关经验,计算机、人工智能、机器学习等相关专业硕士及以上学历,有丰富相关经历的本科生也可以投递。

加分项:

知名开源项目贡献者;

了解深度学习编译器;

获得过编程竞赛奖项;

在顶级会议发表过高质量系统方向的论文。

AI 大模型算法工程师

岗位职责:

熟悉 AI 算法原理或 AI 应用系统;

从事 NLP / 多模态相关机器学习 / 深度学习等技术的研究与应用,包括且不限于对话系统、信息抽取、文档摘要、文本生成等;

探索自然语言、多模态技术在业务中的落地和创新,并迅速进行转化;

研究、实现业界最先进的多语言 NLP / 多模态大模型。

任职要求:

有深度学习、对话系统、文本分析、文本生成等实际项目经验,熟悉深度学习在自然语言处理方向的相关算法、框架和工具链 ( Pytorch, Huggingface ) ,有生成类任务实际项目经验优先;

熟悉 BERT / GPT-3 / Bloom / LLaMa 等 NLP 大模型,有百亿 / 千亿大模型训练调优经验、Prompt 设计经验者优先;

具备良好的编程能力,熟练掌握 Python、数据结构和算法设计,熟悉 Linux / Unix 系统和 Shell 编程,熟练使用 Git;

计算机、自然语言处理、人工智能、机器学习等相关专业硕士及以上学历;

至少 2 年以上自然语言处理相关经验,熟悉自然语言处理、机器学习、深度学习、强化学习等相关算法,对自然语言处理方向有较深和全面的认识。

加分项:

有分布式集群,单机多卡,多机多卡 NLP 大模型预训练,微调及推理经验者优先;

具备英文专业文献阅读能力,能自觉跟踪发展现状,理解算法原理,并进行落地实现,有 NLP 领域高水平 paper 者优先。

AI 大模型推理工程师

岗位职责:

针对 Colossal-AI 深度学习框架算子层的优化,完成深度学习算子在 CUDA 上的实现;

负责和参与机器学习推理引擎的架构设计、系统开发、高性能优化,打造 AI 大模型的基础设施平台。

任职要求:

本科及以上学历,计算机、数学等相关专业;

熟练掌握 C/C++,具有良好的工程能力、编程习惯、以及沟通能力;

熟练掌握 GPU 平台的高性能计算优化技巧;

2 年以上 CUDA/triton 编程工作经验者优先,深入了解 Transformer、LLM 模型者优先考虑。

加分项:

深入了解量化推理者优先;

有 TVM、TensorRT 等推理平台优化经验者优先;

了解并行推理技术的优先;

云计算研发工程师

岗位职责:

负责人工智能云平台核心模块开发,包括训练服务,推理服务。涉及前后端开发。

负责基础设施搭建,如 CI/CD 等,实现云端产品部署 pipeline,支持快速部署产 Demo。

负责云平台管理及性能优化。

任职要求:

熟悉 AWS、Azure、Google Cloud、阿里云等相关云厂商;

熟悉各类常见的分布式框架以及 kubernetes 开发,如 flink、spark、kafka、redis、docker、k8s、terraform 等 ,有 kubernetes operator/crds 开发经验者优先;

熟悉 C++ 编程、Python 编程或者 Go 语言编程,有大型软件编程经验,如:分布式系统、操作系统、编译器、数据库等软件开发经验优先;

熟悉 AI 算法原理或 AI 应用系统;

特别说明:上述岗位 JD 对于特别优秀的校招、实习招候选人工作年限可以放宽要求,不做特定限制。