Merge pull request #308321 from abadawi591/abadawi/send-has-image-to-router

aashna · web-flow · commit 34754a86b5d7 · 2026-04-15T14:34:16.000-07:00
Abadawi/send has image to router
diff --git a/extensions/copilot/src/platform/endpoint/node/automodeService.ts b/extensions/copilot/src/platform/endpoint/node/automodeService.ts
@@ -22,7 +22,7 @@ import { IExperimentationService } from '../../telemetry/common/nullExperimentat
 import { ITelemetryService } from '../../telemetry/common/telemetry';
 import { ICAPIClientService } from '../common/capiClient';
 import { AutoChatEndpoint } from './autoChatEndpoint';
-import { RouterDecisionFetcher, RoutingContextSignals } from './routerDecisionFetcher';
+import { RouterDecisionError, RouterDecisionFetcher, RoutingContextSignals } from './routerDecisionFetcher';
 
 interface AutoModeAPIResponse {
 	available_models: string[];
@@ -201,11 +201,13 @@ export class AutomodeService extends Disposable implements IAutomodeService {
 					"automode.routerFallback" : {
 						"owner": "lramos15",
 						"comment": "Reports when the auto mode router is skipped or fails and falls back to default model selection",
-						"reason": { "classification": "SystemMetaData", "purpose": "PerformanceAndHealth", "comment": "The reason the router was skipped or failed (hasImage, noMatchingEndpoint, routerError, routerTimeout)" }
+						"reason": { "classification": "SystemMetaData", "purpose": "PerformanceAndHealth", "comment": "The reason the router was skipped or failed, e.g. emptyPrompt, emptyCandidateList, noMatchingEndpoint, routerError, routerTimeout, or a server error code" },
+						"hasImage": { "classification": "SystemMetaData", "purpose": "PerformanceAndHealth", "comment": "Whether the request contained an attached image" }
 					}
 				*/
 				this._telemetryService.sendMSFTTelemetryEvent('automode.routerFallback', {
 					reason: routerFallbackReason,
+					hasImage: String(hasImage(chatRequest)),
 				});
 			}
 			selectedModel = this._selectDefaultModel(entry?.endpoint?.modelProvider, token.available_models, knownEndpoints);
@@ -252,10 +254,6 @@ export class AutomodeService extends Disposable implements IAutomodeService {
 		const prompt = chatRequest?.prompt?.trim();
 		const lastRoutedPrompt = entry?.lastRoutedPrompt ?? prompt;
 
-		if (hasImage(chatRequest)) {
-			return { lastRoutedPrompt, fallbackReason: 'hasImage' };
-		}
-
 		if (!this._isRouterEnabled(chatRequest) || conversationId === 'unknown') {
 			return { lastRoutedPrompt };
 		}
@@ -278,7 +276,7 @@ export class AutomodeService extends Disposable implements IAutomodeService {
 				turn_number: (entry?.turnCount ?? 0) + 1,
 			};
 			const routingMethod = this._configurationService.getExperimentBasedConfig(ConfigKey.TeamInternal.AutoModeRoutingMethod, this._expService) || undefined;
-			const result = await this._routerDecisionFetcher.getRouterDecision(prompt, token.session_token, token.available_models, undefined, contextSignals, chatRequest?.sessionId, chatRequest?.id, routingMethod);
+			const result = await this._routerDecisionFetcher.getRouterDecision(prompt, token.session_token, token.available_models, undefined, contextSignals, conversationId, chatRequest?.id, routingMethod, hasImage(chatRequest));
 
 			if (result.fallback) {
 				this._logService.info(`[AutomodeService] Router signaled fallback: ${result.fallback_reason ?? 'unknown'}, routing_method=${result.routing_method ?? 'n/a'}`);
@@ -303,7 +301,14 @@ export class AutomodeService extends Disposable implements IAutomodeService {
 			return { selectedModel, lastRoutedPrompt: prompt };
 		} catch (e) {
 			const isTimeout = isAbortError(e);
-			const fallbackReason = isTimeout ? 'routerTimeout' : 'routerError';
+			let fallbackReason: string;
+			if (isTimeout) {
+				fallbackReason = 'routerTimeout';
+			} else if (e instanceof RouterDecisionError && e.errorCode) {
+				fallbackReason = e.errorCode;
+			} else {
+				fallbackReason = 'routerError';
+			}
 			this._logService.error(`Failed to get routed model for conversation ${conversationId} (${fallbackReason}):`, (e as Error).message);
 			return { lastRoutedPrompt: prompt, fallbackReason };
 		}
diff --git a/extensions/copilot/src/platform/endpoint/node/routerDecisionFetcher.ts b/extensions/copilot/src/platform/endpoint/node/routerDecisionFetcher.ts
@@ -38,6 +38,18 @@ export interface RoutingContextSignals {
 	prompt_char_count?: number;
 }
 
+/**
+ * Thrown when the router API returns a non-OK HTTP response.
+ * Carries the parsed `errorCode` from the response body (e.g. `no_vision_models`)
+ * so callers can classify the failure without string-matching the message.
+ */
+export class RouterDecisionError extends Error {
+	override readonly name = 'RouterDecisionError';
+	constructor(message: string, public readonly errorCode?: string) {
+		super(message);
+	}
+}
+
 /**
  * Fetches routing decisions from a classification API to determine which model should handle a query.
  *
@@ -54,7 +66,7 @@ export class RouterDecisionFetcher {
 	) {
 	}
 
-	async getRouterDecision(query: string, autoModeToken: string, availableModels: string[], stickyThreshold?: number, contextSignals?: RoutingContextSignals, conversationId?: string, vscodeRequestId?: string, routingMethod?: string): Promise<RouterDecisionResponse> {
+	async getRouterDecision(query: string, autoModeToken: string, availableModels: string[], stickyThreshold?: number, contextSignals?: RoutingContextSignals, conversationId?: string, vscodeRequestId?: string, routingMethod?: string, hasImage?: boolean): Promise<RouterDecisionResponse> {
 		const startTime = Date.now();
 		const requestBody: Record<string, unknown> = { prompt: query, available_models: availableModels, ...contextSignals };
 		if (stickyThreshold !== undefined) {
@@ -63,6 +75,9 @@ export class RouterDecisionFetcher {
 		if (routingMethod) {
 			requestBody.routing_method = routingMethod;
 		}
+		if (hasImage) {
+			requestBody.has_image = true;
+		}
 		const copilotToken = (await this._authService.getCopilotToken()).token;
 		const abortController = new AbortController();
 		const timeout = setTimeout(() => abortController.abort(), 1000);
@@ -82,7 +97,15 @@ export class RouterDecisionFetcher {
 		}
 
 		if (!response.ok) {
-			throw new Error(`Router decision request failed with status ${response.status}: ${response.statusText}`);
+			const errorText = await response.text().catch(() => '');
+			let errorCode: string | undefined;
+			try {
+				const parsed = JSON.parse(errorText);
+				if (typeof parsed === 'object' && parsed !== null && 'error' in parsed && typeof parsed.error === 'string') {
+					errorCode = parsed.error;
+				}
+			} catch { /* not JSON */ }
+			throw new RouterDecisionError(`Router decision request failed with status ${response.status}: ${response.statusText}`, errorCode);
 		}
 
 		const text = await response.text();
diff --git a/extensions/copilot/src/platform/endpoint/node/test/automodeService.spec.ts b/extensions/copilot/src/platform/endpoint/node/test/automodeService.spec.ts
@@ -688,40 +688,19 @@ describe('AutomodeService', () => {
 			expect(routerCallCount2).toBe(1);
 		});
 
-		it('should skip router on new turn after a transient fallback reason without invalidation', async () => {
+		it('should skip router on subsequent turns after image request routed on first turn', async () => {
 			enableRouter();
 			const gpt4oEndpoint = createEndpoint('gpt-4o', 'OpenAI', { supportsVision: true });
 			const claudeEndpoint = createEndpoint('claude-sonnet', 'Anthropic');
 
-			(mockCAPIClientService.makeRequest as ReturnType<typeof vi.fn>).mockImplementation((_body: any, opts: any) => {
-				if (opts?.type === RequestType.ModelRouter) {
-					return Promise.resolve({
-						ok: true,
-						status: 200,
-						headers: createMockHeaders(),
-						text: vi.fn().mockResolvedValue(JSON.stringify({
-							predicted_label: 'needs_reasoning',
-							confidence: 0.9,
-							latency_ms: 30,
-							chosen_model: 'claude-sonnet',
-							candidate_models: ['claude-sonnet'],
-							scores: { needs_reasoning: 0.9, no_reasoning: 0.1 },
-							sticky_override: false
-						}))
-					});
-				}
-				return Promise.resolve(
-					makeMockTokenResponse({
-						available_models: ['claude-sonnet', 'gpt-4o'],
-						expires_at: Math.floor(Date.now() / 1000) + 3600,
-						session_token: 'test-token',
-					})
-				);
-			});
+			mockRouterResponse(
+				['gpt-4o', 'claude-sonnet'],
+				{ chosen_model: 'gpt-4o', candidate_models: ['gpt-4o'] }
+			);
 
 			automodeService = createService();
 
-			// Turn 1: image request — router is skipped (transient fallback)
+			// Turn 1: image request — router IS called now
 			const imageRequest: Partial<ChatRequest> = {
 				location: ChatLocation.Panel,
 				prompt: 'describe this image',
@@ -731,22 +710,18 @@ describe('AutomodeService', () => {
 
 			await automodeService.resolveAutoModeEndpoint(imageRequest as ChatRequest, [gpt4oEndpoint, claudeEndpoint]);
 
-			// Turn 2: same prompt (tool-calling iteration) — router should NOT be called
-			const samePromptRequest: Partial<ChatRequest> = {
-				location: ChatLocation.Panel,
-				prompt: 'describe this image',
-				sessionId: 'session-transient-fallback',
-			};
-
-			await automodeService.resolveAutoModeEndpoint(samePromptRequest as ChatRequest, [gpt4oEndpoint, claudeEndpoint]);
-
-			// Router should not have been called for either turn so far
-			expect(mockCAPIClientService.makeRequest).not.toHaveBeenCalledWith(
+			expect(mockCAPIClientService.makeRequest).toHaveBeenCalledWith(
 				expect.anything(),
 				expect.objectContaining({ type: RequestType.ModelRouter })
 			);
+			// Reset mock call tracking
+			(mockCAPIClientService.makeRequest as ReturnType<typeof vi.fn>).mockClear();
+			mockRouterResponse(
+				['gpt-4o', 'claude-sonnet'],
+				{ chosen_model: 'gpt-4o', candidate_models: ['gpt-4o'] }
+			);
 
-			// Turn 3: new prompt — router should still NOT be called (skipped after first turn)
+			// Turn 2: new prompt — router should NOT be called (skipRouter after first turn)
 			const textRequest: Partial<ChatRequest> = {
 				location: ChatLocation.Panel,
 				prompt: 'write a function',
@@ -755,39 +730,166 @@ describe('AutomodeService', () => {
 
 			await automodeService.resolveAutoModeEndpoint(textRequest as ChatRequest, [gpt4oEndpoint, claudeEndpoint]);
 
-			// Router should not have been called at all
+			// Router should not have been called on turn 2
 			expect(mockCAPIClientService.makeRequest).not.toHaveBeenCalledWith(
 				expect.anything(),
 				expect.objectContaining({ type: RequestType.ModelRouter })
 			);
 		});
 
-		it('should skip router for image requests and use default selection', async () => {
+		it('should send has_image to router for image requests', async () => {
 			enableRouter();
 			const gpt4oEndpoint = createEndpoint('gpt-4o', 'OpenAI', { supportsVision: true });
 			const claudeEndpoint = createEndpoint('claude-sonnet', 'Anthropic');
 
 			mockRouterResponse(
-				['claude-sonnet', 'gpt-4o'],
-				{ chosen_model: 'claude-sonnet', candidate_models: ['claude-sonnet'] }
+				['gpt-4o', 'claude-sonnet'],
+				{ chosen_model: 'gpt-4o', candidate_models: ['gpt-4o'] }
 			);
 
 			automodeService = createService();
 			const chatRequest: Partial<ChatRequest> = {
 				location: ChatLocation.Panel,
 				prompt: 'describe this image',
-				sessionId: 'session-vision-skip-router',
+				sessionId: 'session-vision-router',
 				references: [{ id: 'img', value: { mimeType: 'image/png', data: new Uint8Array() } }] as any
 			};
 
 			const result = await automodeService.resolveAutoModeEndpoint(chatRequest as ChatRequest, [gpt4oEndpoint, claudeEndpoint]);
-			// Router should be skipped; vision fallback should pick the vision-capable model
 			expect(result.model).toBe('gpt-4o');
-			// Verify router was NOT called
-			expect(mockCAPIClientService.makeRequest).not.toHaveBeenCalledWith(
+			// Verify router WAS called (not skipped)
+			const routerCall = (mockCAPIClientService.makeRequest as ReturnType<typeof vi.fn>).mock.calls.find(([, opts]) => opts?.type === RequestType.ModelRouter);
+			expect(routerCall).toBeDefined();
+			const [routerRequestBody] = routerCall!;
+			expect(JSON.parse(routerRequestBody.body).has_image).toBe(true);
+		});
+
+		it('should fall back to vision model when router returns no_vision_models error', async () => {
+			enableRouter();
+			const gpt4oEndpoint = createEndpoint('gpt-4o', 'OpenAI', { supportsVision: true });
+			const claudeEndpoint = createEndpoint('claude-sonnet', 'Anthropic');
+
+			(mockCAPIClientService.makeRequest as ReturnType<typeof vi.fn>).mockImplementation((_body: any, opts: any) => {
+				if (opts?.type === RequestType.ModelRouter) {
+					return Promise.resolve({
+						ok: false,
+						status: 400,
+						statusText: 'Bad Request',
+						headers: createMockHeaders(),
+						text: vi.fn().mockResolvedValue(JSON.stringify({ error: 'no_vision_models' }))
+					});
+				}
+				return Promise.resolve(
+					makeMockTokenResponse({
+						available_models: ['gpt-4o', 'claude-sonnet'],
+						expires_at: Math.floor(Date.now() / 1000) + 3600,
+						session_token: 'test-token',
+					})
+				);
+			});
+
+			automodeService = createService();
+			const chatRequest: Partial<ChatRequest> = {
+				location: ChatLocation.Panel,
+				prompt: 'describe this image',
+				sessionId: 'session-no-vision',
+				references: [{ id: 'img', value: { mimeType: 'image/png', data: new Uint8Array() } }] as any
+			};
+
+			const result = await automodeService.resolveAutoModeEndpoint(chatRequest as ChatRequest, [gpt4oEndpoint, claudeEndpoint]);
+			// Should fall back to default selection, then vision fallback picks gpt-4o
+			expect(result.model).toBe('gpt-4o');
+			// Verify the router was called and the error code was passed through from the server
+			expect(mockCAPIClientService.makeRequest).toHaveBeenCalledWith(
 				expect.anything(),
 				expect.objectContaining({ type: RequestType.ModelRouter })
 			);
+			expect(mockLogService.error).toHaveBeenCalledWith(
+				expect.stringContaining('(no_vision_models)'),
+				expect.anything()
+			);
+		});
+
+		it('should fall back to routerError when router returns non-JSON error body', async () => {
+			// When the router returns an HTML error page or other non-JSON body,
+			// errorCode should be undefined and fallbackReason should be 'routerError'
+			// — NOT the raw response body leaked into telemetry.
+			enableRouter();
+			const gpt4oEndpoint = createEndpoint('gpt-4o', 'OpenAI');
+
+			(mockCAPIClientService.makeRequest as ReturnType<typeof vi.fn>).mockImplementation((_body: any, opts: any) => {
+				if (opts?.type === RequestType.ModelRouter) {
+					return Promise.resolve({
+						ok: false,
+						status: 502,
+						statusText: 'Bad Gateway',
+						headers: createMockHeaders(),
+						text: vi.fn().mockResolvedValue('<html><body>Bad Gateway</body></html>')
+					});
+				}
+				return Promise.resolve(
+					makeMockTokenResponse({
+						available_models: ['gpt-4o'],
+						expires_at: Math.floor(Date.now() / 1000) + 3600,
+						session_token: 'test-token',
+					})
+				);
+			});
+
+			automodeService = createService();
+			const chatRequest: Partial<ChatRequest> = {
+				location: ChatLocation.Panel,
+				prompt: 'test prompt',
+				sessionId: 'session-html-error',
+			};
+
+			const result = await automodeService.resolveAutoModeEndpoint(chatRequest as ChatRequest, [gpt4oEndpoint]);
+			expect(result.model).toBe('gpt-4o');
+			// Should log generic 'routerError', NOT the HTML body
+			expect(mockLogService.error).toHaveBeenCalledWith(
+				expect.stringContaining('(routerError)'),
+				expect.anything()
+			);
+		});
+
+		it('should fall back to routerError when router returns JSON without error field', async () => {
+			// When the server returns valid JSON but without an 'error' field,
+			// errorCode should be undefined and fallbackReason should be 'routerError'.
+			enableRouter();
+			const gpt4oEndpoint = createEndpoint('gpt-4o', 'OpenAI');
+
+			(mockCAPIClientService.makeRequest as ReturnType<typeof vi.fn>).mockImplementation((_body: any, opts: any) => {
+				if (opts?.type === RequestType.ModelRouter) {
+					return Promise.resolve({
+						ok: false,
+						status: 400,
+						statusText: 'Bad Request',
+						headers: createMockHeaders(),
+						text: vi.fn().mockResolvedValue(JSON.stringify({ message: 'something went wrong' }))
+					});
+				}
+				return Promise.resolve(
+					makeMockTokenResponse({
+						available_models: ['gpt-4o'],
+						expires_at: Math.floor(Date.now() / 1000) + 3600,
+						session_token: 'test-token',
+					})
+				);
+			});
+
+			automodeService = createService();
+			const chatRequest: Partial<ChatRequest> = {
+				location: ChatLocation.Panel,
+				prompt: 'test prompt',
+				sessionId: 'session-json-no-error',
+			};
+
+			const result = await automodeService.resolveAutoModeEndpoint(chatRequest as ChatRequest, [gpt4oEndpoint]);
+			expect(result.model).toBe('gpt-4o');
+			expect(mockLogService.error).toHaveBeenCalledWith(
+				expect.stringContaining('(routerError)'),
+				expect.anything()
+			);
 		});
 
 		it('should be a no-op when invalidateRouterCache is called with unknown conversationId', async () => {