2024-3-29 01:26 /
今日工作总结

1. 阅读自动上色论文
(1) Learning Inclusion Matching for Animation Paint Bucket Colorization
这篇是NTU最近出的自动上色的文章。内容非常好,看起来也非常专业,一作之前没有做过animation.. 还在读

其他论文
(2) Reconstructing the Mind's Eye: fMRI-to-Image with Contrastive Learning and Diffusion Priors 微软的脑机接口方向的论文,能够把fMRI信号当作condition, 用CLIP和unCLIP实现retreival和generation. 文章的总体思路是当下multi-modality非常标准的格式。
(3) BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models 重读BLIP2这篇文章, mask的描述还不是很理解,需要再看看

2. Scaling Test的工作。修复R@K的bug..
3. 写论文.. pipeline部分的修改工作
4. modality augmentation上机推理
5. 读完富野由悠季的《影像的原则》