📄

CLIP

Entry

Simple Title

Radford, A., Kim, J. W., Hallacy, C., Ramesh, A., Goh, G., Agarwal, S., … Sutskever, I. (2021). Learning Transferable Visual Models From Natural Language Supervision. Retrieved from https://arxiv.org/abs/2103.00020v1

Type
Paper
Year

Posted at
June 2, 2021
Tags
image

Overview

一言まとめ

Abstract

論文のabstract

Motivation

Architecture

Results

Further Thoughts

論文を読んで考えた個人的感想

Links

わかりやすい日本語解説

【論文解説】自然言語処理と画像処理の融合 - OpenAI 『CLIP』を理解する(1)

今回はOpenAIの『CLIP( Contrastive Language- Image P re-training)』を解説したいと思います。 CLIPは画像の分類に利用されるモデルですが、今までのモデルと何が違うかというと、 自然言語処理の技術を応用する 点です。 一般的な画像分類では、たくさんの画像を用意して、それぞれ対して犬、猫、リンゴ、などのラベルをつけます。 ...

【論文解説】自然言語処理と画像処理の融合 - OpenAI 『CLIP』を理解する(1)