Claude 3モデルファミリー AI技術の進化は目覚ましく、その最前線に立つのが「Claude 3 モデルファミリー」です。この新しいモデルファミリーは、Opus、Sonnet、Haikuという3つのAIモデルがあります。 こちらのサイトの内容を解説します。 https://www.anthr…
ハノイの塔は、数学的なパズルゲームの一つで、フランスの数学者エドゥアール・リュカが1883年に考案しました。このゲームの目的は、一連のルールに従いながら、ディスクを一つの柱から別の柱へ移動させることです。小さなディスクから始まって大きなディス…
新しいプロンプト手法 ビジネスにおけるデータ分析や意思決定の助けとしてAIの活用がますます重要になっています。特に、OpenAIのChatGPTのような言語モデルは、ビジネス上の多様な課題に対する洞察や解決策を提供する強力なツールとなり得ます。しかし、AI…
テキストから動画へ OpenAIは2024年2月15日に、テキストプロンプトから最大60秒の動画を生成することができる革新的なAIモデル「Sora」を発表しました。このモデルは、そのリアリズムと複雑なシーンの生成能力で特に注目を集めています。 Soraの特徴 複雑な…
RLHF RLHFは大規模言語モデル(LLM)を人の好みに合わせた出力をするために用いられる手法です。 この技術は強化学習(RL)と人間のフィードバック(HF)を組み合わせた考え方になります。 ChatGPTもRLHFを使ってファインチューニングされています。 原著論文はDee…
生成AIパスポート試験 生成AIに関する資格試験「生成AIパスポート」が開催されます。 生成AIパスポートは一般社団法人生成AI活用普及協会が実施する試験です。 こちらを参考に記事を書いています。 guga.or.jp 試験 生成AIパスポート試験は、AIに関する基礎…
Generative AI Testとは (Generative AI Test 2024時点) 最近、ビジネスや技術の分野で注目されている「生成AI」。その理解を深め、効果的に活用するための一つの方法が「Generative AI Test」です。このミニテストは、日本ディープラーニング協会(JDLA)…
DeprecationWarning このエラーはscipy.sinが非推奨(deprecated)であり、将来のSciPyバージョンでは削除される可能性があることを示しています。 例えば、Python でtransformerのPositional encodingのコードです。 %matplotlib inline import numpy as np f…
今回は画像生成のAI技術であるDALL-E 3について、その使用方法や規約に焦点を当ててご紹介します。 DALL-E 3の利用方法 DALL-E 3は皆さんが普段使っているChatGPTにプロンプトを入力して使うことができます。 ChatGPT PlusではプラグインでDALL-Eを追加する…
BatchNormalization BatchNormalization(バッチ正規化)は、ニューラルネットワークの学習を安定化し、収束を速めるための手法の一つです。これは、各ミニバッチ内での入力データの平均をゼロにし、標準偏差を1に調整することによって、学習の安定性を向上…
解説する論文 タイトル: Splitwise: Efficient Generative LLM Inference Using Phase Splitting 著者: Pratyush Patel, Esha Choukse, Chaojie Zhang, Íñigo Goiri, Aashaka Shah, Saeed Maleki, Ricardo Bianchini 論文のURL: https://arxiv.org/pdf/2311.…
im2colとは im2colは、画像認識において利用される関数で、主に高速な行列演算を活かすために使用されます。この関数は、効率的なnumpyの操作を可能にします。ループを使用することができますが、これはnumpyの優れた特性を活かす点で劣る方法です。(numpy…
Generative AI Testとは 「Generative AI Test」とは、日本ディープラーニング協会(JDLA)が提供する、生成AIに関する知識と活用スキルを評価するためのミニテストです。このテストは、OpenAIやMidjourneyなどの生成AI技術を安全かつ効果的にビジネスで活用…
ソフトマックス関数とは ソフトマックス関数は、複数の数値からなるベクトルを受け取り、それを正規化して確率分布として表現するための関数です。主に機械学習や深層学習の分野で使用されます。この関数は、多クラス分類の出力層や、ニューラルネットワーク…
Generative AI Testとは 「Generative AI Test」とは、生成AIに特化した知識や活用リテラシーを確認するためのミニテストで、一般社団法人日本ディープラーニング協会(JDLA)によって実施されます。このテストは、OpenAIやMidjourneyなどの近年の企業活動で…
解説する論文 タイトル:What Do I Hear? Generating Sounds for Visuals with ChatGPT 著者: David Chuan-En Lin, Nikolas Martelaro 論文のURL: https://arxiv.org/pdf/2311.05609.pdf 論文発表日: 2023年11月9日 専門外の人でも分かる解説 この論文は、Cha…
解説する論文 タイトル: Black-Box Prompt Optimization: Aligning Large Language Models without Model Training 著者: Jiale Cheng, Xiao Liu, Kehan Zheng, Pei Ke, Hongning Wang, Yuxiao Dong, Jie Tang, Minlie Huang 論文のURL: https://arxiv.org/p…
万能近似定理 万能近似定理(Universal approximation theorem)(Hornik et al., 1989; Cybenko, 1989) ネットワークが十分な数の隠れ層を持つ時、線形の出力層と、(ロジスティックシグモイド活性化関数のような)「押しつぶす」事ができる活性化関数を持つ隠れ…
解説する論文 タイトル: Server-side Rescoring of Spoken Entity-centric Knowledge Queries for Virtual Assistants 著者: Youyuan Zhang, Sashank Gondala, Thiago Fraga-Silva, Christophe Van Gysel 論文のURL: https://arxiv.org/pdf/2311.01398.pdf …
解説する論文 タイトル: Recommendations by Concise User Profiles from Review Text 著者: Ghazaleh H. Torbati, Anna Tigunova, Andrew Yates, Gerhard Weikum 論文のURL: https://arxiv.org/pdf/2311.01314.pdf 論文発表日: 2023年1月 専門外の人でも分…
解説する論文 タイトル Is GPT Powerful Enough to Analyze the Emotions of Memes? 著者 Jingjing Wang, Joshua Luo, Grace Yang, Allen Hong, Feng Luo 論文のURL https://arxiv.org/pdf/2311.00223.pdf 論文発表日 2023年11月1日 参考 メームとは https:/…
解説する論文 タイトル: TopicGPT: A Prompt-based Topic Modeling Framework 著者: Chau Minh Pham, Simeng Sun, Alexander Hoyle, Mohit Iyyer 論文のURL: https://arxiv.org/pdf/2311.01449.pdf 論文発表日: 2022年11月 専門外の人でも分かる解説 この論…
要約 タイトル: Chat GPT Integrated with Voice Assistant as Learning Oral Chat-based Constructive Communication to Improve Communicative Competence for EFL Learners 著者: Wei Zhou 論文のURL: https://arxiv.org/pdf/2311.00718.pdf 論文発表日: …
解説する論文 タイトル: GPT-4V(ision) as a Generalist Evaluator for Vision-Language Tasks 著者: Xinlu Zhang, Yujie Lu, Weizhi Wang, An Yan, Jun Yan, Lianke Qin, Heng Wang, Xifeng Yan, William Yang Wang, Linda Ruth Petzold 論文のURL: https:/…
要約 タイトル: Extracting user needs with Chat-GPT for dialogue recommendation 著者: Yugen Sato, Taisei Nakajima, Tatsuki Kawamoto, Tomohiro Takagi 論文のURL: https://arxiv.org/abs/2310.19303 この論文の解説です。 論文発表日: 30 Oct 2023 専…
要約 タイトル: NLP Evaluation in trouble: On the Need to Measure LLM Data Contamination for each Benchmark 著者: Oscar Sainz, Jon Ander Campos, Iker García-Ferrero, Julen Etxaniz, Oier Lopez de Lacalle, Eneko Agirre 論文のURL: https://arxi…
要約 タイトル: Detection of news written by the ChatGPT through authorship attribution performed by a Bidirectional LSTM model 著者: Amanda Ferrari Iaquinta, Gustavo Voltani von Atzingen 論文のURL: https://arxiv.org/abs/2310.16685 この論文…
要約 タイトル: LLM Performance Predictors are good initializers for Architecture Search 著者: Ganesh Jawahar, Muhammad Abdul-Mageed, Laks V. S. Lakshmanan, Dujian Ding 論文のURL: https://arxiv.org/abs/2310.16712 この論文の解説です。 論文発…
要約 タイトル: Can large language models replace humans in the systematic review process? Evaluating GPT-4's efficacy in screening and extracting data from peer-reviewed and grey literature in multiple languages 著者: Qusai Khraisha, Sophi…
タイトル: Causal Inference Using LLM-Guided Discovery 著者: Aniket Vashishtha, Abbavaram Gowtham Reddy, Abhinav Kumar, Saketh Bachu, Vineeth N Balasubramanian, Amit Sharma 論文のURL: https://arxiv.org/abs/2310.15117 この論文の解説です。 論…