Shikoan's ML Blog

AWS Network ManagerのReachability Analyzerを試す

2025-03-08

50{icon} {views} AWSのReachability Analyzerを使うと、NATゲートウェイやネットワークACLなどの通信経路を自動解析して接続障害の原因を即座に突き止められる。プライベートNATの誤 […]...

2025-03-05

57{icon} {views} ALBのリスナールールでソースIPを指定し、WAFを使わずに簡易的なアクセス制限を行える。Terraformにより特定IP向けの固定レスポンスルールを設定し、EC2インスタンスから動作を […]...

2025-03-05

99{icon} {views} LLM推論にかかるGPUインスタンス料金やトークン生成速度、サービス提供単価などを数式で統合し、黒字化の条件を理論的に示した。実験結果では、GPU以外のボトルネックの影響は小さく、高い稼 […]...

2025-03-03

107{icon} {views} Network FirewallはAZ単位の設計とパブリックIPの有無に注意しつつ、ステートレス・ステートフル両方のルールとCloudWatch Logsへのログ出力による高い可視化が […]...

2025-03-02

100{icon} {views} クロスゾーン負荷分散が有効なNLBをVPCエンドポイントサービスと連携し、CIDR重複時でもインターネット経由せずに通信できる例をTerraformで構築します。プライベートホストゾー […]...

2025-02-28

319{icon} {views} OpenAIがGPT-4.5をリリースし、画像入出力やSVG生成などのマルチモーダル機能が大幅に強化された。その一方でモデルの大規模化に伴い高額な利用料金がネックになっている。解禁さ […]...

2025-02-28

116{icon} {views} Vision TransformerとGrid Transformerを組み合わせ、視覚・テキストの両面からマルチモーダル情報を効果的に活用する手法VGTを提案。多様な文書タイプと詳細 […]...

2025-02-22

242{icon} {views} LLM推論時にGPU以外が占める遅延要因（SQSのバッチ処理やログ書き込み等）を実験的に検証し、オーバーヘッドは入力トークン数に対してほぼ線形に近似できることを示した。トークナイザーの […]...

2025-02-21

44{icon} {views} タイトル：Mélange: Cost Efficient Large Language Model Serving by Exploiting GPU Heterogeneity 論文U […]...

2025-02-17

44{icon} {views} Auto Scaling GroupのStopped状態のウォームプールを利用することで、初回セットアップを終えたインスタンスを停止したまま待機させ、必要時に素早く起動できる。Activ […]...