ITエンジニア ノイのブログ

ITエンジニアのノイです。 YouTubeで ITエンジニアのお勉強という学習用の動画を公開しています。チャンネル登録お願いします!https://m.youtube.com/channel/UCBKfJIMVWXd3ReG_FDh31Aw/playlists

Googleの最新AIモデル「Gemma 2」の概要

Googleの最新AIモデル「Gemma 2」の凄さと使い方 目次 Gemma 2の紹介 主な特徴 使用例と応用範囲 導入方法 Geminiとの使い分け 適用シナリオ まとめ 1. Gemma 2の紹介 Googleの革新: Googleが開発した最先端AI言語モデル 利用環境: Vertex AIおよびGKE上で利…

SearchGPT AI検索機能の新しい可能性

目次 SearchGPTとは 新しい検索方法 ユーザーエクスペリエンス 出版社およびクリエイターとの連携 グーグルへの挑戦 今後の展望 活用方法 まとめ SearchGPTとは SearchGPT プロトタイプの概要 SearchGPTは、AIモデルとWeb情報を組み合わせた新しい検索機能で…

論文解説 ハルシネーションの検出と推定方法に関する研究

タイトル: ハルシネーションの検出と推定方法に関する研究 対象の論文 https://arxiv.org/pdf/2406.15927 アブストラクトの要約 研究目的: AIモデルが生成する「ハルシネーション」を検出する新しい方法を提案 背景: 従来の手法では、ハルシネーションの検出…

GPT-4o Mini

現代のAI技術は日々進化を遂げていますが、その中でも特に注目を集めているのが、OpenAIが提供する「GPT-4o Mini」です。高性能かつコスト効率の良いこの小型モデルは、幅広いビジネスアプリケーションに適用可能であり、その技術的革新とビジネスインパクト…

AIニュース OpenAIの新AIモデルGPT-4oポルノフレーズで汚染

2024年5月にOpenAIは最新のAIモデル「GPT-4o」を発表した。高い処理能力が期待されていたが、中国語ユーザーからトレーニングデータに関する問題が指摘されている。トークンデータがスパムやポルノフレーズで汚染されているという報告が上がっている。 GPT-4…

論文解説 AI言語モデル、マルチモーダル生成の調査研究

解説する論文 タイトル: LLMs Meet Multimodal Generation and Editing: A Survey 著者: Yingqing He, Zhaoyang Liu, Jingye Chen, Zeyue Tian, Hongyu Liu, Xiaowei Chi, Runtao Liu, Ruibin Yuan, Yazhou Xing, Wenhai Wang, Jifeng Dai, Yong Zhang, Wei …

論文解説 汎用サービスロボットのタスク計画にLLM

解説する論文 タイトル: LLM-based Robot Task Planning with Exceptional Handling for General Purpose Service Robots 著者: Ruoyu Wang, Zhipeng Yang, Zinan Zhao, Xinyan Tong, Zhi Hong, Kun Qian 発表日: 2024年5月24日 論文のリンク: LLM-based Rob…

論文解説 LLMによる自動脆弱性修正

解説する論文 タイトル: A Case Study of LLM for Automated Vulnerability Repair: Assessing Impact of Reasoning and Patch Validation Feedback 著者: Ummay Kulsum, Haotian Zhu, Bowen Xu, Marcelo d'Amorim 発表日: 2024年5月24日 論文のリンク: A Ca…

論文解説 ユニバーサルRAG

マルチモーダル大規模言語モデルの性能を強化するユニバーサルな情報検索技術! 解説する論文 タイトル: UniRAG: Universal Retrieval Augmentation for Multi-Modal Large Language Models 著者: Sahel Sharifymoghaddam, Shivani Upadhyay, Wenhu Chen, Ji…

論文解説 LLMと画像を融合したRPA

解説する論文 タイトル: SmartFlow: Robotic Process Automation using LLMs 著者: Arushi Jain, Shubham Paliwal, Monika Sharma, Lovekesh Vig, Gautam Shroff 発表日: 2024年5月21日 論文のリンク: SmartFlow: Robotic Process Automation using LLMs Fig…

論文解説 ChatGPTがソフト開発にどのように影響を与えるかの調査

解説する論文 タイトル: Developers' Perceptions on the Impact of ChatGPT in Software Development: A Survey 著者: Thiago S. Vaillant, Felipe Deveza de Almeida, Paulo Anselmo M. S. Neto, Cuiyun Gao, Jan Bosch, Eduardo Santana de Almeida 発表…

論文解説 GPT-4がチューリングテストを通過

解説する論文 タイトル: People cannot distinguish GPT-4 from a human in a Turing test 著者: Cameron R. Jones, Benjamin K. Bergen 発表日: 2024年5月9日 論文のリンク: People cannot distinguish GPT-4 from a human in a Turing test 要約 専門外の…

論文解説 GPT-4oとGemini 1.5 Proの多ショット比較

解説する論文 タイトル: Many-Shot In-Context Learning in Multimodal Foundation Models 著者: Yixing Jiang, Jeremy Irvin, Ji Hun Wang, Muhammad Ahmed Chaudhry, Jonathan H. Chen, Andrew Y. Ng 発表日: 2024年5月16日 論文のリンク: Many-Shot In-Co…

AIニュース Google、新たなGeminiおよびGemmaモデルを発表

Google、新たなGeminiおよびGemmaモデルを発表 Googleは2024年5月14日、Gemini 1.5 Proのアップデート、1.5 Flashモデルのデビュー、そして2つの新しいGemmaモデルを発表した。これにより、AI開発者向けの新しい機能と価格オプションも提供されることとなっ…

AIニュース OpenAI、GPT-4oを発表

OpenAI、GPT-4oを発表 OpenAIは2024年5月13日、新たなフラッグシップモデル「GPT-4o」を発表した。このモデルはテキスト、音声、画像、動画の入力をリアルタイムで処理し、テキスト、音声、画像の出力を生成できる。特に非英語言語のテキスト処理能力が向上…

論文解説 小規模LLMの最適化能力の限界

解説する論文 タイトル: Revisiting OPRO: The Limitations of Small-Scale LLMs as Optimizers 著者: Tuo Zhang, Jinyue Yuan, Salman Avestimehr 発表日: 2024年5月16日 論文のリンク: Revisiting OPRO: The Limitations of Small-Scale LLMs as Optimizer…

論文解説 LLMを3Dデータに適応

解説する論文 タイトル: When LLMs step into the 3D World: A Survey and Meta-Analysis of 3D Tasks via Multi-modal Large Language Models 著者: Xianzheng Ma, Yash Bhalgat, Brandon Smart, Shuai Chen, Xinghui Li, Jian Ding, Jindong Gu, Dave Zhen…

論文解説 化学分子オフライン最適化手法

解説する論文 タイトル: ALMol: Aligned Language-Molecule Translation LLMs through Offline Preference Contrastive Optimisation 著者: Dimitris Gkoumas 発表日: 2024年5月15日 論文のリンク: ALMol: Aligned Language-Molecule Translation LLMs throu…

論文解説 航空規則(RAC)へのLLM活用

解説する論文 タイトル: Towards Enhanced RAC Accessibility: Leveraging Datasets and LLMs 著者: Edison Jair Bejarano Sepulveda, Nicolai Potes Hector, Santiago Pineda Montoya, Felipe Ivan Rodriguez, Jaime Enrique Orduy, Alec Rosales Cabezas, …

論文解説 化学におけるLLMとメッセージパッシング

解説する論文 タイトル: Could Chemical LLMs benefit from Message Passing 著者:Jiaqing Xie, Ziheng Chi 発表日:2024年5月14日 論文のリンク: Could Chemical LLMs benefit from Message Passing 要約 専門外の人でも分かる要約 この論文では、化学分野で…

変分自己符号化器:VAE 1

変分自己符号化器(Variational Autoencoder, VAE)は、機械学習の一種で、特に生成モデルとして使われます。変分自己符号化器の基本的な考え方は、データを低次元の潜在空間に圧縮し、その空間からデータを再構成することにあります。 主要な構成要素 エン…

論文解説 LLMは意味論をどれだけ捉えるか

解説する論文 タイトル: Potential and Limitations of LLMs in Capturing Structured Semantics: A Case Study on SRL 著者: Ning Cheng, Zhaohui Yan, Ziming Wang, Zhijie Li, Jiaming Yu, Zilong Zheng, Kewei Tu, Jinan Xu, Wenjuan Han 論文のURL: arX…

E資格のためのフローベース生成モデル

フローベース生成モデルは、データの分布を学習し、新しいデータを生成するための機械学習モデルです。 画像生成モデルには次のようなものがありますが、その中の一つフローベース生成モデルについて解説します。 GANやVAE フローベース生成モデル 拡散モデ…

論文解説 自動運転の分野でマルチモーダル大規模言語モデル

解説する論文 タイトル: Probing Multimodal LLMs as World Models for Driving 著者: Shiva Sreeram, Tsun-Hsuan Wang, Alaa Maalouf, Guy Rosman, Sertac Karaman, Daniela Rus 論文のURL: arXivリンク 発表日: 2024年5月9日 専門外の人でも分かる解説 こ…

E資格のためのWasserstein GAN

解説する論文 タイトル: Wasserstein GAN 著者: Martin Arjovsky, Soumith Chintala, Léon Bottou 論文のURL: arXiv PDFリンク 専門外の人でもざっくり分かる解説 この研究は、Wasserstein GAN(WGAN)という新しいタイプの生成敵対ネットワーク(GAN)を導…

論文解説 人間が書いたか?LLMが書いたか?

解説する論文 タイトル: Who Wrote This? The Key to Zero-Shot LLM-Generated Text Detection Is GECScore 著者: Junchao Wu, Runzhe Zhan, Derek F. Wong, Shu Yang, Xuebo Liu, Lidia S. Chao, Min Zhang 論文のURL: arXivリンク 発表日: 2024年5月7日 専…

論文解説 LLMを用いた電子健康記録(EHRs)を調査

解説する論文 タイトル: A scoping review of using Large Language Models (LLMs) to investigate Electronic Health Records (EHRs) 著者: Lingyao Li et al. 論文のURL: arXiv 発表日: 2024年5月5日 専門外の人でも分かる解説 このレビューは、大規模言語…

論文解説 LLMによる医師の意思決定

解説する論文 タイトル: Adaptive Collaboration Strategy for LLMs in Medical Decision Making 著者: Yubin Kim, Chanwoo Park, Hyewon Jeong, Yik Siu Chan, Xuhai Xu, Daniel McDuff, Cynthia Breazeal, Hae Won Park 論文のURL: arXivリンク 発表日: 20…

論文解説 LLMで医療会話から医療ノート生成

解説する論文 タイトル: A Continued Pretrained LLM Approach for Automatic Medical Note Generation 著者: Dong Yuan et al. 論文のURL: arXivリンク 発表日: 2024年3月14日 専門外の人でも分かる解説 この研究は、医療会話から自動的に医療ノートを生成…

論文解説 LLMsの医療利用における倫理的考察

解説する論文 タイトル: The Ethics of ChatGPT in Medicine and Healthcare: A Systematic Review on Large Language Models (LLMs) 著者: Joschka Haltaufderheide, Robert Ranisch 論文のURL: arXivリンク 発表日: 2024年3月21日 専門外の人でも分かる解説…