本文整理了一些AI应用任务,区别于过程或者研究意义上的任务,比如光流估计,这里强调直接应用.
不要关注方法,因为方法可能瞬息万变,关注一下输入输出的连接性、类型以及效果(成功率)

CV

  • 去噪 img2img
  • 清晰度增强 img2img
  • 风格迁移 img2img
  • 抠图/消除物体 img2img* 2
  • 目标识别与跟踪 img2img location
  • 运动估计、定位 img2 location vec
  • 三维建模 img2model
  • 转换(换人、换脸、换物体)img2 img
  • 电影上色 gray2rgb
  • OCR

NLP

  • 语音识别(speech2text)
  • 语音合成(text2speech)
  • 实体分割与关系抽取(text2struct)
  • 程序合成 (text2struct)
  • 文本转换(扩写、改写、缩写、内容提取、翻译)
  • 问答系统
  • 情感分析
  • 文本分类/聚类
  • 校对
  • 搜索
  • 语音唤醒
  • 降噪
  • 多源声音定位

video=img+voice+time series

多模态:

  • 文生图/视频(text2img,video)
  • 图片理解、视频理解(img,video2text)
  • 图生成视频/模型